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Vorwort 



Statistische Methoden finden heute in den verschiedensten 
Disziplinen Anwendung, beispielsweise in Physik, Biologie, 
Medizin, Psychologie, Linguistik und nicht zuletzt in den 
Wirtschaftswissenschaften. In der Medizin z. B. benötigt 
man statistische Methoden unter anderem zur Beurteilung der 
Wirksamkeit verschiedener Medikamente; Biologen bedienen 
sich statistischer Methoden bei genetischen Untersuchungen, 
Wirtschaftswissenschaftler bei der Aufdeckung von Interde- 
pendenzen zwischen verschiedenen ökonomischen Variablen: 
Immer wenn aus Stichprobendaten Schlußfolgerungen zu ziehen 
sind, greift man auf statistische Methoden zurück. 

Um die Schlußweisen der Statistik schon an dieser Stelle 
wenigstens skizzieren zu können, betrachten wir ein Bei- 
spiel aus dem Bereich der Wirtschaftswissenschaften. In- 
terdependenzen zwischen den Nachfragemengen und den Prei- 
sen von Gütern erklärt man vielfach durch wahrscheinlich- 
keitstheoretische Modelle, die unbekannte Parameter ent- 
halten. Erst die tatsächlich beobachteten Kombinationen 
von Preisen und Nachfragemengen - Stichprobendaten also - 
ermöglichen eine "Schätzung" der unbekannten Parameter 
des zugrundegelegten Modells. Oft sind auch gewisse Vor- 
stellungen über realisierte Parameter vorhanden. Stich- 
probendaten erlauben dann, Urteile darüber abzugeben, ob 
diese Vorstellungen, die meist Hypothesen genannt werden, 
zutreffen oder nicht. Diese zweite Art des Schließens 
nennt man üblicherweise "Testen". 

Das vorliegende Buch ist in 5 Teile und einen Anhang ge- 
gliedert. In einem ersten Teil wird das wahrscheinlich- 
keitstheoretische Instrumentarium bereitgestellt, das zur 
Darstellung der Grundgedanken des statistischen Schließens 
benötigt wird. Diese Grundgedanken selbst sind in den Tei- 
len SCHÄTZEN und TESTEN behandelt. Die Teile AUSWAHLVERFAH- 
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REN UND SCHÄTZUNG und REGRESS ION SANALYSE sind der Anwendung 
dieser Grundgedanken auf besonders wichtige Modelle Vorbe- 
halten. 

Die Lektüre des Buches erfordert nur elementare mathemati- 
sche Kenntnisse. Die für das Verständnis wesentlichen Teile 
der Mengenalgebra und der Kombinatorik sowie die Rechenre- 
geln für das Summenzeichen sind im Anhang zusammengestellt. 
Ferner befinden sich im Anhang alle statistischen Tabellen, 
die zur Lösung von Aufgaben benötigt werden. 

Die Abbildungen sind in den genannten 5 Teilen des Buches 
und auch im Anhang jeweils durchnumeriert. Bei der Numerie- 
rung der Formeln ist es als zweckmäßig betrachtet worden, 
jeweils bei Abschnitten, die eine eigene Überschrift tragen, 
mit der Numerierung neu zu beginnen. Diese Abschnitte selbst 
sind in Unterabschnitte gegliedert, die mit Textziffern ver- 
sehen sind. 

Bei Verweisen bedeuten 

W WAHRSCHEINLICHKEITSRECHNUNG 
S SCHÄTZEN 

AS AUSWAHLVERFAHREN UND SCHÄTZUNG 
T TESTEN 

R REGRESSIONSANALYSE 
A ANHANG . 

Mit W 3.4.6 ist also die Textziffer 3.4.6 des Teiles WAHR- 
SCHEINLICHKEITSRECHNUNG gemeint. Bei Verweisen innerhalb 
eines Teiles entfällt der Kennbuchstabe. In der WAHRSCHEIN- 
LICHKEITSRECHNUNG wird also 3.4.3 geschrieben statt W 3.4.3. 
Zum leichteren Auffinden der Formeln wird beim Zitieren der 
Formelnummer die entsprechende Textziffer und gegebenenfalls 
der Hinweis auf den entsprechenden Teil des Buches vorange- 
stellt. Da sich Formel (5) des Abschnitts 1.6 der WAHRSCHEIN- 
LICHKEITSRECHNUNG unter der Textziffer 1.6.3 befindet, wird 
auf diese Formel also durch 1.6.3 (5) im Teil WAHRSCHEINLICH- 
KEITSRECHNUNG und durch W 1.6.3 (5) in allen anderen Teilen 

verwiesen . 
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Definitionen und Bezeichnungen sind an der Stelle, an der 
sie eingeführt werden, kursiv geschrieben. 

Abschnitte, die für das Verständnis späterer Teile des Bu- 
ches weniger wichtig erscheinen, sind mit * versehen. Leser, 
die möglichst schnell einen Überblick über die in den Teilen 
SCHÄTZEN, AUSWAHLVERFAHREN UND SCHÄTZUNG, TESTEN und REGRES- 
SIONSANALYSE behandelten Probleme der schließenden Statistik 
gewinnen möchten, können diese Abschnitte auslassen. 

Im Literaturverzeichnis sind vor allem diejenigen deutsch- 
sprachigen Lehrbücher auf geführt, deren Lektüre zur Ergän- 
zung oder zur Vertiefung des hier dargestellten Stoffes 
empf ehlenswert erscheint; es ist nur eine kleine Auswahl 
englischsprachiger Lehrbücher auf genommen. 



Mannheim, Februar 1976 



Die Autoren 
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Wahrscheinlichkeitsrechnung 



1. Zufallsexperimente und Wahrscheinlichkeiten 



1.1 Zufallsexperimente, Ergebnismengen und 
Ereignisse 

1.1.1 In der Umgangssprache kommt das Wort "Wahrscheinlich- 
keit" in verschiedener Bedeutung vor. Wir sagen beispiels- 
weise, für einen gewissen Einbruchdiebstahl sei wahrschein- 
lich der Vorbestrafte A verantwortlich, höchstwahrschein- 
lich stamme das Gedicht B nicht von Shakespeare, auf dem 
Mars gebe es wahrscheinlich keine Lebewesen. Wir sagen auch, 
die nächste Ziehung der Lottozahlen werde wahrscheinlich 
nicht nur einstellige Zahlen liefern, man könne bei 50-maligem 
Würfeln mit großer Wahrscheinlichkeit wenigstens einmal die 
Augenzahl 6 erwarten, das Werfen einer Münze ergebe "Kopf" 
und "Wappen" mit derselben Wahrscheinlichkeit. 

Durch die Vokabeln "wahrscheinlich" und "höchstwahrscheinlich" 
wird in den zuerst angeführten Formulierungen zum Ausdruck 
gebracht, wie sehr der Sprechende von der Richtigkeit einer 
umstrittenen Aussage über Vergangenheit und Gegenwart über- 
zeugt ist; diese Formulierungen werden uns nicht weiter be- 
schäftigen. Die Ermittlung der Lottozahlen, das Ausspielen 
eines Würfels und das Werfen einer Münze dagegen sind Vor- 
gänge, die zwei für uns wichtige Eigenschaften gemeinsam 
haben : 

(a) Ihr Resultat läßt sich nicht mit Sicherheit Vorhersagen. 
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(b) Sie lassen sich wiederholen, und zwar so, daß keine 
Durchführung irgendeine andere beeinflußt. 

Vorgänge, die die Eigenschaften (a) und (b) aufweisen, 
nennt man Zufallsexperimente. 

1.1.2 Die Menge 9 aller möglichen Ergebnisse eines Zu- 
fallsexperiments nennen wir Ergebnismenge des Zufallsexpe- 
riments. Beim Ausspielen eines Würfels beispielsweise wer- 
den die möglichen Ergebnisse durch die Augenzahlen 
1, 2, ..., 6 beschrieben; also ist 

n = {i, 2, 6} 

die Ergebnismenge dieses Zufallsexperiments. Eine Roulette- 
ausspielung führt zu einem der Ergebnisse 0, 1, ..., 36 , 
so daß man als Ergebnismenge erhält 

Q, = {o, 1, • • • r 36} . 

Ergebnismengen müssen nicht unbedingt endlich sein. Nehmen 
wir beispielsweise an, man stelle Glühlampen nach einem be- 
stimmten Verfahren her. Bei wiederholter Durchführung dieses 
Verfahrens erhält man Glühlampen, die sich im Hinblick auf 
Merkmale wie Brenndauer, Helligkeit, Durchmesser, Gewicht 
unterscheiden. Wenn z. B. die Merkmale "Brenndauer" und "Ge- 
wicht" interessieren, liefert jede Durchführung des Herstel- 
lungsprozesses ein Paar nichtnegativer Zahlen, und man hat 
als Ergebnismenge 



9 = { (x,y) : x > 0, y > o}. 

1.1.3 Nun interessiere ein spezielles Zufallsexperiment mit 
der Ergebnismenge 9 . Dann nennen wir jede Teilmenge von 9 
ein Ereignis des Zufallsexperiments. Wenn das Ergebnis einer 
Durchführung des Zufallsexperiments in ACfi liegt, sagt man, 
das Ereignis A sei eingetreten. 
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1.1.4 Wenn A ein Ereignis ist, wird 



A = {e e : e ^ A} 

zu A komplementäres Ereignis genannt. Ä tritt genau 
dann ein, wenn A nicht eintritt. 

Wenn A^ , A^ , . . . , A^ Ereignisse sind, werden die Ereignisse 

{ e e Q, : e e A^ für wenigstens ein i} 

{e e ü : e e A^ für alle i} 

als Vereinigung bzw. als Durchschnitt von A^ , A^, ..., A^ 

n 

bezeichnet. A. tritt genau dann ein, wenn wenigstens 

i = 1 1 

n 

eines der Ereignisse A. eintritt; C'' A. tritt dagegen 

1 i = 1 1 

genau dann ein, wenn alle Ereignisse A^ (gleichzeitig) 
eintreten . 

Ereignisse A und B mit AaB = 0 schließen sich gegen- 
seitig aus, d. h. wenn A eintritt, kann B nicht eintre- 
ten und umgekehrt; sie heißen daher paarweise unvereinbar 
oder kurz unvereinbar. Sind A , A^ , . .., A paarweise un- 
vereinbare Ereignisse, d. h. 

A i A A j = ^ für i 1 j / 

so können nicht mehrere Ereignisse A^ gleichzeitig eintre- 
ten und die Ereignisse A^ , A 2 , ..., A r bilden eine Zerle- 

n 

gung des Ereignisses A = \J A . . 

i = 1 1 



n 

\J 

i = 1 



n 

r\ 

i = 1 



A. = 
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Betrachten wir etwa das Ausspielen eines Würfels. Man hat 
ft = {l, 2, 3, 4, 5, 6} , und es ist beispielsweise 



A = {2,4,6} 

das Ereignis, daß eine gerade Augenzahl auftritt, 

B = {1,2,3} 

das Ereignis, daß die gewürfelte Zahl höchstens gleich 3 
ist und 



C = {5,6} 

das Ereignis, daß die auftretende Augenzahl mindestens 5 
ist . 

Liefert die Würfelausspielung die Augenzahl 2 , so sind die 
Ereignisse A und B eingetreten, C dagegen nicht. 

ft sei die Ergebnismenge eines Zufallsexperiments. Dann tritt 
ft bei jeder Durchführung des Zufallsexperiments ein und 
heißt daher sicheres Ereignis . Die leere Menge 0 ist eine 
Teilmenge von ft , und damit ebenfalls ein Ereignis. 0 
tritt bei keiner Durchführung ein und wird unmögliches Er- 
eignis genannt. 

Die Ereignisse, die nur ein Ergebnis enthalten, heißen Ele- 
mentarereignisse. Ein Ereignis, das zwei oder mehr Ergebnis- 
se umfaßt, heißt zusammengesetztes Ereignis . Beim Ausspielen 
eines Würfels etwa sind { 1 } , {2}, ..., {6} Elementarereig- 
nisse. A = {2,4,6} ist ein zusammengesetztes Ereignis. Man 
erkennt unschwer, daß die Zahl der Ergebnisse eines Zufalls- 
experiments gleich der Zahl der Elementarereignisse ist. Wenn 
nämlich ft = {e^ ..., e k J gilt und somit e 1 , e 2 , ..., e k 
die Ergebnisse des betrachteten Zufallsexperiments sind, sind 
{ e ^ } , { e 2 } , ..., {e k } die Elementarereignisse dieses Zufalls- 
experiments . 
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1.1.5 Beispiel: Wir betrachten das Ausspielen eines Wür- 

fels, ein Zuf allsexperiment also mit der Ergebnismenge 



a = { 1 , 2 , 6 } 

und definieren folgende Ereignisse 
A = {2,4,6} 

B = {1,3} 

C = {1,2} 

D = {5} . 

Dann ist D ein Elementarereignis, während A, B und C 
zusammengesetzte Ereignisse sind. Die Ereignisse A, B und D 
bilden eine Zerlegung von ft . 



1.2 Zusammengesetzte Zufallsexperimente 

1.2.1 Wir betrachten zwei Zufallsexperimente mit den Ergeb- 
nismengen ft^ bzw. ft 2 ' beide Experimente sollen gleich- 
zeitig oder kurz nacheinander durchgeführt werden. Wenn das 
erste Zufallsexperiment zum Ergebnis e^ führt und das zweite 
zum Ergebnis e 2 , wird man sagen, das in der Zusammenfassung 
der Teilexperimente bestehende Zufallsexperiment liefere das 
Ergebnis (e.j,e 2 ) . Für die Ergebnismenge ft dieses Zufalls- 

experiments gilt 

ft = { (e^ ,e 2 ) : e ft^ e 2 e ft 2 ) 

= ft^ x ft 2 . 

ft ist also das kartesische Produkt von ft ^ und ft 2 . Spielt 
man beispielsweise ein Rouletterad und einen Würfel aus, so 
hat man 
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{ O , 2 , « • • , 36} 

= {1, 2, 3 , 4, 5, 6} . 

Als Ergebnis der beiden Ausspielungen wird man das Zahlen- 
paar (i,j) notieren, wenn Roulette und Würfel die Ergeb- 
nisse i bzw. j liefern. Als Ergebnismenge erhält man 
also die aus 37 »6 = 222 Elementen bestehende Menge 

« = { (i , j ) : i = 0, 1, 36 ; j = 1, 2, 6} 

= ft^ x ^2 • 

Sind A.j C ft i und A 2 C ft 2 Ereignisse zweier Teilexperimente 
mit den Ergebnismengen ft^ und ft 2 / so ist 

A = A 1 x A 2 = {(e,j,e 2 ) : e^ e A 1 , e 2 e A 2 } 

ein Ereignis des Gesamtexperiments: A tritt genau dann ein, 

wenn beim ersten Teilexperiment A^ eintritt und beim zweiten 
Teilexperiment A 2 . So tritt etwa beim vorangehend erwähnten 
Roulette-Würfelbeispiel das Ereignis 

{0} x {2, 4, 6} 

genau dann ein, wenn die Rouletteausspielung zum Ergebnis 0 
führt und beim Würfeln eine gerade Augenzahl auftritt. 

1.2.2 Natürlich kann man auch mehr als zwei Zufallsexperi- 
mente zu einem neuen Experiment zusammen fassen . Wenn 
ft^ , ft 2 , ..., ft R die Ergebnismengen von n Teilexperimenten 
sind, ist x ft 2 x ... x ft^ offensichtlich die Ergebnis- 

menge des Gesamtexperiments . 

Nehmen wir beispielsweise an, man spiele einen Würfel n-mal 
aus. Dann ist jede einzelne Ausspielung ein Zufallsexperiment, 
und die n Ausspielungen zusammen stellen ebenfalls ein Zu- 
fallsexperiment dar. 
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Für die Ergebnismengen . .., ft n der n Teilexperi- 

mente gilt offensichtlich 

ft -j = ^2 = ••• = = { ^ / 2 / * • • r 6}. 

Für die Ergebnismenge ft des Gesamtexperiments hat man 

ft = { (i ^ / •••/ i n ) : i *| / ^2 ' * • • ' = ^ ' 2 , • • • / 6 

Im Falle n = 2 ist ft also speziell die Menge aller 36 
Zahlenpaare, die mit Hilfe der Zahlen 1, 2, 6 gebil- 

det werden können. 

1.2.3 Angenommen, man drehe ein Rouletterad und werfe gleich- 
zeitig einen Würfel: Wie sollte die Würfelausspielung das Dre- 
hen des Rouletterades beeinflussen? Welche Auswirkungen sollte 
umgekehrt die Rouletteausspielung für die Würfelausspielung 
haben? 

Ganz allgemein wird man davon ausgehen dürfen, daß Zufalls- 
experimente sich gegenseitig nicht beeinflussen, gleichgültig 
ob sie gleichzeitig oder nacheinander durchgeführt werden. 

Um dies hervorzuheben, bezeichnen wir die Teilexperimente, 
aus denen' ein Zufallsexperiment besteht, häufig als unabhän- 
gig. Wenn die Teilexperimente identisch sind, sagt man, das 
zusammengesetzte Zufallsexperiment entstehe durch unabhängige 
Wiederholung eines Zufallsexperiments. Beispielsweise kommt 
also das n-malige Ausspielen eines Würfels durch unabhän- 
gige Wiederholung eines Zufallsexperiments - des einmaligen 
Würfelns nämlich - zustande. 



1 .3 Symmetrische Zufallsexperimente 

1.3.1 Es liege ein Würfel vor, dessen Ecken, Kanten und 
Seitenflächen keine Unregelmäßigkeiten aufweisen. Bekannt 
sei, daß der Würfel aus einem homogenen Material gefertigt ist. 
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Man bezeichnet einen derartigen Würfel als echt oder auch 
als ideal. 



Betrachten wir folgendes Glücksspiel: Ein idealer Würfel 
wird ausgespielt; wenn die Augenzahl 6 auf tritt, erhält 
jeder Teilnehmer 1000 DM; wenn eine von 6 verschiedene 
Augenzahl gewürfelt wird, zahlt jeder Teilnehmer 100 DM. 

Ob jemand bereit ist, an dem beschriebenen Spiel teilzuneh- 
men, hängt von seinen persönlichen Nutzenvorstellungen ab. 

Wer nicht dazu bereit ist, würde eine Teilnahme sicherlich 
auch dann ablehnen, wenn die Auszahlung von 1000 DM an das 
Auftreten der Augenzahl 5 geknüpft wäre und sonst 100 DM 
gezahlt werden müßten. 

1.3.2 Allgemeiner werde nun ein Zufallsexperiment mit einer 

endlichen Ergebnismenge tt = {e^, •••/ e^} betrachtet; 

die Ergebnisse e^, e^, ..., e^. seien gleichwertig in fol- 
gendem Sinne: Ob eine Maßnahme A genau dann durchgeführt 
wird, wenn das Zufallsexperiment e^ liefert, oder ob A 
genau dann durchgeführt wird, wenn sich einstellt, . . . 

oder ob die Durchführung von A an das Eintreten von e^ 
geknüpft wird, ist für alle Betroffenen ohne Bedeutung; dies 
soll gelten, gleichgültig welche Maßnahme mit A bezeichnet 
ist. Ein Zufallsexperiment mit dieser Eigenschaft soll symme- 
trisch genannt werden. 

1.3.3 Neben dem Ausspielen eines echten Würfels sind bei- 
spielsweise das Werfen einer Münze und das Drehen eines 
Rouletterades symmetrische Zufallsexperimente. Wir betrach- 
ten weitere Beispiele. 

Eine Urne sei gefüllt mit gleichartigen Kugeln, die von 1 
bis N numeriert sind. Man mischt die Kugeln und greift 
willkürlich eine Kugel heraus. Die Nummer der herausgegrif- 
fenen Kugel bezeichnet man als Ergebnis. Dieser Vorgang 
darf als symmetrisches Zufallsexperiment mit der Ergebnis- 
menge {l, 2, ..., n} angesehen werden. 
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Wenn nicht eine, sondern n Kugeln herausgegriffen werden 
- wenn also n-mal gezogen wird ohne Zurüoklegen 3 wie man 
auch sagt - ist wiederum ein Zufallsexperiment festgelegt. 
Wir wollen mit ft die Gesamtheit aller n-Tupel bezeich- 
nen, die unter Verwendung von Elementen der Menge 
{l, 2, n} ohne Wiederholung gebildet werden können. 

Im Falle N = 3 und n = 2 gilt also beispielsweise 

ü = 1(1,2), (1,3), (2,1), (2,3), (3,1), (3,2)} . 

ft ist dann die Ergebnismenge des betrachteten Zufallsexpe- 
riments. Offensichtlich kann dieses Zufallsexperiment als 
symmetrisch angesehen werden. Wieso sollte jemand eine für 
ihn wünschenswerte Maßnahme z. B. lieber mit dem Eintreten 
des Ergebnisses (1, 2, ..., n) als mit dem Eintreten des 
Ergebnisses (N-n+1 , N-n+2 , ..., N) gekoppelt sehen? 



1.4 Häufigkeit und Wahrscheinlichkeitsaxiome 



1.4.1 Wir betrachten ein Zufallsexperiment und ein Ereig- 
nis A - man denke beispielsweise an das Ausspielen eines 
echten Würfels und setze A = {6} . Das Zufallsexperiment 

soll n-mal durchgeführt werden. Wir bezeichnen die Anzahl 
der Durchführungen, bei denen A eintritt, als absolute 
Häufigkeit f (A) . 



h n <A > 



£ n< A) 

n 



wird relative Häufigkeit des Eintretens von A bei n 
Durchführungen genannt. 



Nun wiederholen wir die beschriebene Versuchsserie der Län- 
ge n mehrmals. Vermutlich wird uns jede Versuchsserie eine 
andere relative Häufigkeit liefern. Wir markieren die beobach- 
teten Häufigkeiten auf einer Zahlengeraden. Die so entste- 
hende Punktwolke ist, wie wir aufgrund unserer Erfahrung mit 
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Zufallsexperimenten wissen, in der Umgebung von 1/6 dichter 
als im äußeren Bereich. Sie könnte etwa folgendes Aussehen 
haben: 



__l » , » • • L« » m • 1 • — 

0 1 /6 2/6 
relative Häufigkeit 

Abb. 1 

Jetzt führen wir mehrere entsprechende Versuchsserien der 
Länge 4 n durch und markieren wiederum die relativen Häu- 
figkeiten des Ereignisses A . Wir erhalten dadurch eine 
Punktwolke, die dichter ist als die ursprüngliche. Der mitt- 
lere Bereich der neuen Punktwolke ist wiederum besonders 
dicht und ist eine Teilmenge des Bereichs, in dem schon die 
ursprüngliche Punktwolke einigermaßen dicht war - jedenfalls 
erwarten wir dieses Phänomen aufgrund unserer Erfahrungen. 



0 



Abb. 2 



, 1 1 1 «» t « • i 

1 /6 2/6 
relative Häufigkeit 



Und wenn die Versuchsserie weiter verlängert wird, "stabi- 
lisiert" sich die relative Häufigkeit von A zunehmend, sie 
"tendiert" gegen einen bestimmten Wert. Diesen Wert, den wir 
nicht kennen, dessen Existenz wir aber aufgrund unserer Er- 
fahrung als gesichert ansehen, bezeichnen wir als die Wahr- 
scheinlichkeit W (A) des Ereignisses A . 



1.4.2 Für die relativen Häufigkeiten gilt in jeder Versuchs- 
serie aus n Durchführungen des Zufallsexperiments 

0 < h n (A) < 1 für jedes Ereignis A (1) 

h n (Q) = 1 . ( 2 ) 

Sind A und B unvereinbare Ereignisse, so ist die abso- 
lute Häufigkeit der Vereinigung A\j B gleich der Summe 
der absoluten Häufigkeiten der Ereignisse A und B ; aus 
AaB =0 folgt also 
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f (A V B) = f (A) + f (B) 
n v n n 

und hieraus nach Division durch n 

h n (AvB) = h n (A) + h n ( ß ) • (3) 

Da die Wahrscheinlichkeiten von Ereignissen mit ihren rela- 
tiven Häufigkeiten in enger Beziehung stehen, darf man an- 
nehmen, daß in Analogie zu den Gleichungen (1), (2) und 

(3) gilt 

(I) W(A) > O für beliebige Ereignisse A 

(II) W(fi) = 1 

(III) W(Av/B) = W(A)+W(B) für unvereinbare Ereignisse 

A und B . 

Unsere Erfahrung deutet also darauf hin, daß durch ein Zu- 
fallsexperiment mit der Ergebnismenge 0, den Ereignissen 
A, B, ... Cft Zahlen W(A), W(B), ... mit den Eigenschaf- 

ten (I), (II) und (III) - sogenannte Wahrscheinlichkei- 
ten - zugeordnet sind. Da es keine Möglichkeit gibt, die 
Annahmen (I) , (II) und (III) aus einfacheren Annahmen 
abzuleiten, bezeichnet man (I), (II) und (III) als Wahr- 
schein lichkeitsaxiome . 

1.4.3 Ob man ein Zufallsexperiment mit der Ergebnismenge ü 
unbedingt durch Angabe der Wahrscheinlichkeiten aller Teil- 
mengen von Q beschreiben sollte, kann dahingestellt blei- 
ben. Es leuchtet ein, daß in vielen Fällen nur einige wenige 
Ereignisse interessieren und die Wahrscheinlichkeiten aller 
übrigen Ereignisse belanglos sind. Die mathematischen Proble- 
me, die bei der Festlegung der Klasse der sogenannten "inte- 
ressanten" Ereignisse entstehen, sollen hier ausgeklammert 
werden. Wir verweisen in diesem Zusammenhang auf die einschlä- 
gigen Lehrbücher, insbesondere auf FISZ (1973), S. 21 ff . 
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Dort wird auch dargelegt, daß es zweckmäßig ist, Axiom (III) 
durch eine stärkere Forderung zu ersetzen, worauf wir aber 
der Einfachheit halber verzichten. 



1.5 Folgerungen aus den Wahrscheinlichkeitsaxiomen 

1.5.1 ft sei eine Ergebnismenge. Den Teilmengen von ft 
seien Wahrscheinlichkeiten zugeordnet, für die die Axiome 
(I), (II) und (III) des vorangehenden Abschnitts zutreffen. 
Nun gebe man uns ein bestimmtes Ereignis ACft an und teile 
uns seine Wahrscheinlichkeit mit. Dann kennen wir auch die 
Wahrscheinlichkeit von Ä . Es gilt nämlich 

W(Ä) = 1 - w(A) , 

denn die Ereignisse A und Ä bilden eine Zerlegung von ft 
(vgl. Abb. 3) , so daß mit (II) und (III) folgt 



W(A) + W (Ä) = W(ft) = 1 . 




Abb. 3 

Insbesondere gilt also 

W (0 ) = 1 - W(ft) = 0 . 

1.5.2 Wenn A und B beliebige Ereignisse sind mit ACB , 
gilt 



W ( A) < W (B) 
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denn die Ereignisse A und A/\B bilden eine Zerlegung von 
B , so daß nach (III) 

W(B) = W(A) + W(Ä aB) 

erfüllt ist, woraus die Behauptung wegen (I) folgt. 

Wenn wir in der Ungleichung W(A) < W(B) speziell B = ft 
setzen, erhalten wir unter Berücksichtigung von (I) und 
(II) 

0 < W (A) < 1. (1 ) 

Diese Doppelungleichung ist für beliebige Ereignisse A 
richtig . 

1.5.3 Jetzt nehmen wir an, . . . , A n seien paarweise 

unvereinbare Ereignisse mit den Wahrscheinlichkeiten 
W(A^), W(A 2 ), ..., W(A n ) . Dann berechnet man die Wahrschein- 
n 

lichkeit von \J A. nach der Formel 
i=1 1 

n n 

W ( \J A. ) = l W(A ). (2) 

i=1 i=1 



Nach (III) gilt nämlich 



W(\^A..) = W ( A i \7A n ) = W ( ^ A.) + W(A n ). 

i=1 i=1 i=1 



Entsprechend hat man 



n-1 

W( \J A 
i=1 1 



n-2 

W ( \J A i ) + W(A n _ 1 ) 



und erhält durch Einsetzen 



n 

W( \J A. ) 
i=1 1 



n-2 

W( \J A i ) + W(A n _ 1 ) + W(A n ) . 
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In der beschriebenen Weise fortfahrend erhält man die Behaup- 
tung. 

1.5.4 Wenn A und B beliebige Ereignisse sind und die 
Wahrscheinlichkeiten 

W(A) , W (B) , W(A A B) 

bekannt sind, kann 

W(A v/B) 

berechnet werden. Denn es gilt der sogenannte Additionssatz 
der Wahrscheinlichkeitsrechnung 

W(AvB) = W ( A) + W (B) - W(A A B) . (3) 

Wir wollen diesen Satz beweisen. 

Da die Ereignisse A und Ä a B eine Zerlegung von 
bilden, hat man nach (III) 

W(A V B) = W (A) + W(XaB). (4) 

Nun bilden die Ereignisse AaB und A/\B eine Zerlegung 
von B (vgl. Abb. 4), so daß 

W (B ) = W(A a B) + W(Ä A B) 

und damit gleichbedeutend 

W(X A B) = W (B ) - W(AaB) (5) 

erfüllt ist. Aus (4) und (5) folgt die Behäuptung (3) . 
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Abb. 4 

Wegen eines naheliegenden Additionssatzes für drei Ereignis- 
se verweisen wir auf Aufgabe 1.8.2 . 



1.6 Wahrscheinlichkeiten bei zusammengesetzten 
Zufallsexperimenten 

1.6.1 Wir betrachten ein beliebiges Zufallsexperiment £ mit 
der Ergebnismenge ü . Wie können die Wahrscheinlichkeiten 
ermittelt werden, die C den Teilmengen von Q zuordnet? 

Diese Frage wird uns erst in dem Teil SCHÄTZEN ausführ- 
licher beschäftigen. Im Rahmen der Wahrscheinlichkeits- 
rechnung läßt sie sich nur für einige spezielle Zufallsex- 
perimente behandeln. Im vorliegenden Abschnitt gehen wir 
davon aus, £ bestehe aus zwei unabhängigen Teilexperimen- 
ten ^ und mit den Ergebnismengen und • 

Bekannt seien die Wahrscheinlichkeiten der Teilmengen von 
und der Teilmengen von ^ ; die zuerst genannten Wahr- 
scheinlichkeiten sind offensichtlich durch festgelegt, 

die zuletzt genannten durch & 2 • 

1.6.2 Wir wählen A^ C ^ beliebig. Die Wahrscheinlichkeit, 
mit der A^ eintritt, wenn nur das 1. Zufallsexperiment 
durchgeführt wird, haben wir mit W(A^) zu bezeichnen. 

W (A^ x ^ 2 ) ist dagegen die Wahrscheinlichkeit dafür, daß 
das 1. Zufallsexperiment A^ liefert, wenn es zusammen 
mit dem 2. Zufallsexperiment durchgeführt wird. Wenn also 

W ( A 1 x fl 2 ) ? W(A 1 ) 
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gilt, hat das 2. Zufallsexperiment Einfluß auf das Eintre- 
ten von . W (A^ x > W(A.j) z. B. würde bedeuten, daß 

die Durchführung des 2. Zufallsexperiments das Eintreten von 
A^ beim 1. Zufallsexperiment begünstigt. Nun sollen die bei- 
den Teilexperimente aber unabhängig sein. Also muß gelten 

W(A 1 x n 2 ) = W(A 1 ) . (1) 

Für beliebiges A 2 C fi 2 Süt entsprechend 

W(fl 1 x A 2 ) = W(A 2 ) . (2) 

1.6.3 Wir wählen nun zwei Ereignisse und A^dü^ 

der betrachteten Teilexperimente aus. Angenommen, man hätte 



W(A 1 x a 2 ) > W(A 1 x « 2 ) w(n 1 x a 2 ) 



(3) 



Dann würde bei häufiger Durchführung des Gesamtexperiments 
für die relativen Häufigkeiten der Ereignisse A^ x A 2 ' 

A^ x fi 2 , x A 2 9 e l ten 



h n (A 1 


X 


a 2 ) 


> h 

n 


(A 1 x n 2 ) 


h n<“l 


x A 2 ) 


f n (A 1 


X 


A 2 > 


f 

> -ü. 


(A 1 x Q 2 ) 


hji < 


x A 2 ) 




n 






n 


f n (A 1 


X 


a 2 ) 


> h 


( x A 2' 






f n (A 1 


X 


tt 2 ) 


n 


r • 





d. h. 



d. h. 



Auf der linken Seite der letzten Ungleichung steht die 
relative Häufigkeit des Ereignisses unter den Durch- 

führungen des Gesamtexperiments, bei denen im ersten Teil- 
experiment das Ereignis A^ eingetreten ist. Die Unglei- 
chung besagt also, daß unter diesen Durchführungen des 
Gesamtexperiments das Ereignis A 2 häufiger als sonst 
eintritt, d. h. daß das Ereignis A^ das Ereignis A 2 be- 
günstigt. 
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Entsprechend bedeutet die Ungleichung 



W(A 1 x A ) < W(A 1 x n 2 ) w(n 1 x a 2 ) (4) 

daß das Ereignis A«j das Ereignis A 2 behindert. 

Weil die beiden Teilexperimente unabhängig sind, kann also 
weder (3) noch (4) gelten, und es folgt 

w(A 1 x a 2 ) = w(a 1 x n 2 ) w(n 1 x a 2 ) . 

Da keine Beeinflussung möglich ist, gelten aber auch (1) 
und (2) , und wir erhalten 

W(A x A 2 ) = W^) W(A 2 ) . (5) 

1.6.4 Beispiel: Ein Würfel, bei dem die Augenzahlen 1, 

2,3 je mit der Wahrscheinlichkeit ~ und die Augenzahlen 

y 2 

4,5,6 je mit der Wahrscheinlichkeit ^ auftreten, wird 
zweimal ausgespielt. Mit welcher Wahrscheinlichkeit sind 
beide auftretenden Augenzahlen gerade? 

Für die Wahrscheinlichkeit, mit der beim einmaligen Aus- 
spielen des Würfels das Ereignis A = {2, 4, 6} eintritt, 
gilt 



W(A) = W ( { 2 } ) + W ( { 4 } ) + W ( { 6 } ) =| + | + |=f- 

Da die beiden Ausspielungen des Würfels offensichtlich 
unabhängige Experimente sind, folgt 

W(A X A) = W(A) W(A) = | • | = -|| . 

Die Wahrscheinlichkeit, bei beiden Ausspielungen des Wür- 
fels eine gerade Augenzahl zu erhalten, ist also gleich 
25 

81 • 
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1.6.5 Wir betrachten nun allgemeiner Zufallsexperimente, 
die aus n unabhängigen Teilexperimenten zusammengesetzt 
sind. Speziell kann ein solches Zufallsexperiment - wie 
z. B. das n-malige Ausspielen eines Würfels - aus n Durch- 
führungen ein und desselben Zufallsexperiments bestehen; 
das Gesamtexperiment setzt sich dann also aus n identi- 
schen Teilexperimenten zusammen. 

Die Ergebnismenge fi eines Zufallsexperiments, das sich 
aus n Zufallsexperimenten mit den Ergebnismengen 
fi-|, ß 2 ' •••' zusammensetzt, ist das kartesische Pro- 

dukt der Mengen , ß 2 , •••/ 

ß = x x . . . x ft 
12 n 

— ^2* • • • f ® *] e ^ 'i / • • • / } • 

Sind A 2 C^ 2 , ..., A n C Ereignisse für die 

Teilexperimente, so ist 

A = A- x A n x ... x A 
1 2 n 

{ ( e 1 , e 2 , . . . , e n ) : e 1 e A^ , e 2 e A 2 , . . . , e n e A n } 

ein Ereignis des Gesamtexperiments. Man überlegt sich 
leicht, daß wegen der Unabhängigkeit der Teilexperimente 
gilt 



W ( A 1 x A 0 x ••• x A ) = W(AJ W(A 0 ) ••• W (A ) . 

I z n i z n 

1.6.6 Nehmen wir jetzt an, es seien ein Zufallsexperiment 
mit der Ergebnismenge n und ein Ereignis A<Z& 0 vor- 
gegeben, und es werde zur Abkürzung gesetzt 

0 = W (A) . 
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Nun führe man das Zufallsexperiment n-mal unabhängig durch. 
Mit welcher Wahrscheinlichkeit tritt dabei A genau m-mal 
ein, wenn m eine der Zahlen 0, 1, 2, n ist? 

Die Wahrscheinlichkeit des Ereignisses 

AxAx ... xAxÄxÄx ... xÄ 



m Faktoren 



n-m Faktoren 



ist offensichtlich 



e • (i-e>.(i-e) ... (i-e) = e m (i-e) n ~ m J 



m Faktoren 



n-m Faktoren 



Das Ereignis 



Ax ... xAxAxAxAx ... xA 



m-1 Faktoren 



n-m-1 Faktoren 



tritt mit der Wahrscheinlichkeit 



e • (i-e) • e • (i-e) ... (i-e) = e m (i-e) nm 



m-1 Faktoren 



n-m-1 Faktoren 



ein. Mit derselben Wahrscheinlichkeit e m (1-0) n m tritt 
jedes kartesische Produkt ein, das m-mal den Faktor A und 
(n-m) -mal den Faktor Ä enthält. Da es (^) derartige 
Produkte gibt (vgl. A 1.2.8), ist 



(-e-(i-e)' 



( 6 ) 



die gesuchte Wahrscheinlichkeit. 
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1.6.7 Beispiel: Ein Würfel liefere die Augenzahl 6 mit 

der Wahrscheinlichkeit -1 . Dieser Würfel werde nun 10-mal 

6 

ausgespielt. Die Wahrscheinlichkeit dafür, daß genau ein- 
mal die Augenzahl 6 erscheint, ist dann nach (6) 

mu)’ (i) 10 "’ ■ •>.>»• 



1.6.8 Wir betrachten ein Zufallsexperiment mit der Ergeb- 
nismenge ß . A^ , A 2 , ..., A^ seien Ereignisse, die eine 
Zerlegung von ß bilden. Wir setzen für i = 1, 2, ..., k 

0 i = W(A i ) . 

Nun werde das betrachtete Zufallsexperiment n-mal unabhän- 
gig durchgeführt. Wenn n^ , n 2 , ..., n^ vorgegebene 

nichtnegative ganze Zahlen sind mit 

k 

n = I n ± 

i=1 

so treten bei den n Durchführungen die Ereignisse 

A^ , A 2 , •••/ A^ jeweils n^-mal, n 2 -mal, ... bzw. n^.-mal 

ein mit der Wahrscheinlichkeit 



1 

1 




V 





(7) 



Der Beweis von (7) verläuft analog zum Beweis von (6) . 



1.6.9 Wir betrachten ein Beispiel. 



Ein Würfel liefere die Augenzahlen 1,2, 3, 4, 5, 6 je 

mit der Wahrscheinlichkeit — . Die Wahrscheinlichkeit da- 

b 

für, daß sich bei 6-maligem Ausspielen des Würfels jede 
mögliche Augenzahl genau einmal einstellt, ist nach (7) 



61 

1 ! 1 ! ... 1 ! 





(i) 



>6 



0,0154 . 
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1.7 Wahrscheinlichkeiten bei symmetrischen 
Zufallsexperimenten 

1.7.1 Wir wollen uns überlegen, daß die in 1.6.1 gestell- 
te Frage nach der Bestimmung der Wahrscheinlichkeiten insbe- 
sondere für symmetrische Zufallsexperimente leicht zu beant- 
worten ist. Nehmen wir also an, 

a = ( ® -) / e 2 » • • w e k } 

sei die Ergebnismenge eines symmetrischen Zufallsexperiments. 
Wir unterstellen einmal, man hätte 

W ( { e 1 } ) > W({e 2 }) . 

Wenn wir für A Cft mit h (A) die relative Häufigkeit 
von A bei n Durchführungen bezeichnen, wäre bei Gültig- 
keit der angegebenen Ungleichung für großes n 

h n ( { e lÜ > h n ( h 2 Ü 

zu erwarten, und e^ und e 2 wären nicht gleichwertig 
im Sinne unserer Symmetriedefinition: Eine Belohnung, die 
mit dem Ergebnis e^ gekoppelt ist, wäre vorteilhafter als 
eine an e 2 gekoppelte Belohnung derselben Höhe. 

Dieselbe Überlegung, die vorangehend für e^ und e 2 
durchgeführt wurde, läßt sich für beliebige e^ e ß , e^ e 
mit i f j durchführen. Also gilt 

W ( { e 1 } ) = W({e 2 }) = ... = W({e k }) . 

D. h. alle Elementarereignisse besitzen dieselbe Wahrschein- 
lichkeit. Da die Elementarereignisse { e ^ } , {e 2 } , ..., {e^} 
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eine Zerlegung des sicheren Ereignisses fl bilden, gilt 
k 

l W( { e . } ) = W (ß) = 1 
i=1 1 



und es folgt für i = 1, 2, . .., k 




Nun sei A ein beliebiges Ereignis. Da die Elementarereig- 
nisse {e i } mit e i eA eine Zerlegung von A bilden, gilt 

W(A) = l W({e.}) = X | A| . 
e^ e A 

Bei symmetrischen Zufallsexperimenten ist die Wahrschein- 
lichkeit eines Ereignisses A also gleich dem Quotienten 
aus der Anzahl der in A zusammengefaßten und der Anzahl - 
aller möglichen Ergebnisse 

WtA) - . 

1.7.2 Beispiel : a) Beim Werfen eines idealen Würfels 

beispielsweise tritt demnach jede Augenzahl mit der Wahr- 
scheinlichkeit 1/6 auf. Die Wahrscheinlichkeit für das 
Auftreten einer geraden Augenzahl ist 1/2 . 

b) Beim Ausspielen eines Rouletterades erhält man mit der 
1 8 

Wahrscheinlichkeit eine rote Zahl. Von den beim Aus- 

spielen möglichen Zahlen 0, 1, 2, ..., 36 sind nämlich 
18 "rot". 

1.7.3 Ein Zufallsexperiment sei aus zwei unabhängigen 
symmetrischen Teilexperimenten mit den Ergebnismengen 
und fl 2 zusammengesetzt. Die Ergebnismenge des Gesamtex- 
periments ist dann 

fl = fl^ x fl 2 . 
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Nun seien Ereignisse / A 2^-^2 vorgegeben. Nach 

1.6.3 (5) gilt wegen der Unabhängigkeit der Experimente 



W(A 1 x A 2 ) = W(A 1 ) W(A 2 ) . 

Weil die Teilexperimente symmetrisch sind, hat man für 
i = 1, 2 



und es folgt 

W(A 1 x A 2 ) 




Nun gilt aber 

|A 1 ! • |a 2 ! = |A 1 X a 2 | 

• | n 2 1 = |n 1 X n 2 | = |n| 

so daß sich ergibt 

|A X A ? i 

W(A. X A,) = — . 

1 2 |ß| 

Wenn A^ und A 2 Elementarereignisse sind, erhält man 
insbesondere 

W (A 1 X A ) = — — . 

1 2 |ß| 



Demnach besitzen alle Elementarereignisse des zusammenge- 
setzten Zufallsexperiments dieselbe Wahrscheinlichkeit. All- 
gemeiner läßt sich zeigen, daß jedes Zufallsexperiment, 
das sich aus n unabhängigen symmetrischen Zuf allsexperi-- 
menten zusammensetzt, den Elementarereignissen dieselbe 
Wahrscheinlichkeit zuordnet. 
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1.7.4 Beispiel: Eine Urne enthalte N Kugeln, die wir 

uns von 1 bis N numeriert denken. Das zufällige Heraus- 
greifen einer Kugel ist dann ein symmetrisches Zufallsex- 
periment mit der Ergebnismenge 

= {1, 2 N} . 

Man sagt, man ziehe n Kugeln mit Zurüeklegen, wenn das 
beschriebene Zufallsexperiment n-mal unabhängig durchgeführt 
wird - wenn man also n Ziehungen vornimmt, die Kugeln 
der Urne vor jeder Ziehung mischt und vor jedem Mischen 
die gezogene Kugel in die Urne zurücklegt. 

Wenn N = 3 ist und 2-mal mit Zurücklegen gezogen wird, 
können als Ergebnisse die folgenden Zahlenpaare auftreten 

(1.1) , (1,2), (1,3) 

(2.1) , (2,2), (2,3) 

(3.1) , (3,2), (3,3), 

Ganz allgemein ist ft Q x ft Q die Ergebnismenge des im 
2-maligen Ziehen mit Zurücklegen bestehenden Zufallsexperi- 
ments. Bei n-maligem Ziehen mit Zurücklegen erhält man als 
Ergebnismenge 

ft X ft X . . . X ft . 

CO o 

^ 

V 

n Faktoren 

Jedes aus den Zahlen 1, 2, ..., N gebildete n-Tupel 
ist Element dieser Menge? insbesondere gehören die n-Tupel, 
in denen einige der Zahlen 1, 2, ..., N mehrfach Vorkom- 

men, zur Ergebnismenge. 

Alle Elementarereignisse des n-maligen Ziehens mit Zurück- 
legen besitzen dieselbe Wahrscheinlichkeit, da das Ziehen 
mit Zurücklegen offenbar die Zusammenfassung unabhängiger 
Einzelziehungen ist, die ja symmetrische Zufallsexperimente 
sind. 
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1.7.5 Um einzusehen, daß die Elementarereignisse einer 
Zusammenfassung symmetrischer Zufallsexperimente dieselbe 
Wahrscheinlichkeit besitzen, braucht man nicht unbedingt 
die Überlegungen in 1.7.3 anzustellen. Man könnte sich 
statt dessen klarmachen, daß durch Zusammenfassung symme- 
trischer Zufallsexperimente wieder ein symmetrisches Zu- 
fallsexperiment entsteht. 

Betrachten wir beispielsweise das zweimalige Ausspielen 
eines idealen Würfels. Man verlange von jemandem vor der 
Ausspielung eine Entscheidung für eine der beiden folgen- 
den Möglichkeiten: 

a) Er erhält 1000 DM, wenn der 1 . Wurf die Augenzahl 4 
und der 2. Wurf die Augenzahl 5 liefert; andernfalls 
zahlt er 10 DM. 

b) Er erhält 1000 DM, wenn der 1 . Wurf die Augenzahl 6 
und der 2. Wurf die Augenzahl 1 liefert; andernfalls 
zahlt er 10 DM. 

Sicherlich ist der Betroffene indifferent zwischen beiden 
Möglichkeiten; und er ist bestimmt auch indifferent gegen- 
über den Vereinbarungen, die die Auszahlung der 1000 DM an 
irgendeines der 36 Elementarereignisse knüpfen. 



1.8 Aufgaben 

1.8.1 Ein Würfel wird zweimal ausgespielt. 

a) Geben Sie die Ergebnismenge und die folgenden Ereig- 
nisse an 

A: Die beiden Augenzahlen sind verschieden 

B: Die Augensumme ist gerade 
C: Die Augensumme ist höchstens 4 
D: Die zweite Augenzahl ist gerade 

E: Die zweite Augenzahl ist nicht größer als die erste. 
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b) Um welche Ereignisse handelt es sich bei 



A v B , A^C, B a D, DaE ? 



Lösung : 

a) Die Ergebnismenge für das zweimalige Ausspielen eines 
Würfels ist 



ü = 


{ ca. 


rj) 


: i,j = 


1 , 


2, . 


• • , 


6} 


• 








Es gilt 
























A = 


{ (i, 


r j) 


: i/j = 


1, 


2, . 


• • , 


6; 


i 




j} 




= 


t (1. 


r 2) , 


(1,3) , 


. . . 


., (1 


,6) 


, (2 


,D 


, 


(2 


,3), ... 








(2,6), , 




r (6, 


D , 


(6, 


2) , 






, (6,5)} 


B = 


{(1, 


r j) 


•* i , j = 


1 , 


2, . 


• • , 


6; 


i 


+ 


j 


gerade} 


= 


{(1- 


rU , 


(1,3) , 


(1 . 


,5) , 


(2, 


2) , 


(2, 


4) 


1 , 


(2,6), . 



(5,1), (5,3), (5,5), (6,2), (6,4), (6,6)} 

C= { ( i , j ) : i , j = 1, 2, ..., 6; i + j < 4} 

= {(1,1), (1,2), (1,3), (2,1), (2,2), (3,1)}. 

D = { (i , j ) si = 1,2, .*.,6; j=2, 4, 6} 

= {(1,2), (1,4), (1,6), (2,2), (2,4), (2,6), ..., 

(6,2), (6,4), (6,6)} 

E = { (i , j ) : i , j = 1, 2, ..., 6; j < i} 

= {(1,1), (2,1), (2,2), (3,1), (3,2), (3,3), ..., 

( 6 , 1 ), ( 6 , 2 ), ..., ( 6 , 6 )} . 



b) Man hat 

A \j B = • 

AaC = { (1,2) , (1,3) , (2,1) , (3,1) } . 
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B A D = {(i,j) : i, j = 2 , 4, 6} 

={(2,2), (2,4), (2,6), (4,2), (4,4), (4,6), 

(6,2), (6,4), (6,6)} . 

D/\E = { ( i , j ) : i = 1, 2, . . . , 6 ; j = 1, 3, 5; i < j } 

={(1,3), (2,3), (1,5), (2,5), (3,5), (4,5)} . 



1.8.2 Zeigen Sie, daß für drei beliebige Ereignisse A, 

B, C gilt 

W(AvB \J C) = W (A) + W(B) + W(C) - W(A A B) 

-W(A^C) - W(B/\C) + W(A A B^C) . 

Lösung : 

Wir setzen 

D = AsjB . 



Dann gilt A\yB v C = D^C und deshalb 

W(Av B v C) = W(D V C) . (1 ) 

Auf die rechte Seite von (1) wenden wir den Additions- 
satz an und erhalten 

W(DvC) = W(D) + W(C) - W(DaC) . (2) 

Nach dem Additionssatz gilt auch 
W(D) = W(A\jB) 

= W(A) + W(B) - W(AaB) . (3) 



Aus 



( 1 ) , ( 2 ) und ( 3 ) 

W(A V ;B V C) = W(A) 



ergibt sich 



(4) 

+ W(B) + W(C) - W(AaB) - W(DAC) . 
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Nun gilt 



DaC = (A^B)r\C 

= (A aC)v (B^C) , 

Vgl. Abb . 5, in der (AvB)AC als schraffierte Fläche 
dargestellt ist. 




Abb. 5 

Aus dem Additionssatz erhält man also 

W(DaC) = W(AAC) + W(BAC) - W((AaC) a\(B^C)) 
und wegen (AaC) a (BaC) = AaBAC 

W(DAC) = W (A A\C ) + W(BAC) - W(AaBAC) . (5) 

Aus (4) und (5) folgt die Behauptung. 

1.8.3 Zeigen Sie: Sind A und B Ereignisse mit 
W(A AB) = W ( A ) • W ( B ) 
so gilt auch 

W(ÄAB) = W(Ä)- W(B) 
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Lösung : 



Mit A 1.1.11 und dem Additionssatz für Wahrscheinlichkeiten 
ergibt sich 

W(ÄAB) = W(ÄÄJb) = 1 - W(AvB) 

= 1 - W(A) - W(B) + W(AAB) 

= 1 - W(A) - W(B) + W(A)- W(B) 

= [1 - W(A) ] [ 1 - W(B) ] = W(X) • W(B) 

1.8.4 Ein Gerät besteht aus drei (voneinander unabhängigen) 
Teilen, die jeweils mit der Wahrscheinlichkeit 0,1 im 
Laufe eines Jahres defekt werden. Das Gerät ist defekt, 
wenn eines der Teile ausfällt. Mit welcher Wahrscheinlich- 
keit muß das Gerät während des Jahres repariert werden? 

Lösung : 

Wir numerieren die drei Teile von 1 bis 3 und bezeichnen 
mit A^ das Ereignis: Der Teil i des Geräts wird im 
Laufe des Jahres defekt (i = 1, 2, 3) . A sei das Ereignis 
Das Gerät muß während des Jahres repariert werden. Es ist 
dann 



A = A^ x A 2 x A 3 . 

Wegen der Unabhängigkeit der einzelnen Teile folgt 

W(Ä) = W(Ä 1 ) W(Ä 2 ) W(Ä 3 ) . 

Nach Annahme gilt für i = 1, 2, 3 

W(Ä ± ) = 1 - W(A i ) = 0,9 

und damit 

W (Ä) = 0,9 • 0,9 • 0,9 = 0,729 . 
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Es ergibt sich 



W(A) = 1 - W(A) = 0,271 . 

Das Gerät muß also mit der Wahrscheinlichkeit 0,271 wäh- 
rend des Jahres repariert werden. 



1.8.5 Wie oft muß man einen echten Würfel ausspielen, um 
mit einer Wahrscheinlichkeit von (mindestens) 0,9 wenig- 
stens eine 6 zu erhalten? 

Lösung : 

Die Ergebnismenge ß für das n-malige Ausspielen eines 
Würfels ist das n-fache Produkt x ^ x ... x der 

Ergebnismenge ß^ = {l, 2, ..., 6} für das einmalige Aus- 
spielen des Würfels. Wir bezeichnen mit A das Ereignis, 
daß wenigstens eine 6 auftritt. Das Komplement Ä tritt 
genau dann ein, wenn bei allen n Würfen keine 6 er- 
scheint: Ä ist daher gleich dem n-fachen Produkt 

A 1 x A 1 x ... x A 1 mit A^ = { 1 , 2, ..., 5}cß-j . 

Es folgt 

W(Ä) = [w{A 1 )] n = (|) d. h. 

- 5 n 

W(A) = 1 - W(A) = 1 - (|) . 



Um 



W(A) > 0,9 

zu erreichen, muß n > x gewählt werden, wobei gilt 
5 X 

1 - (|) = 0,9 d. h. 
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Durch Logarithmieren ergibt sich 



x log | = log 0, 1 = - 1 d. h. 

x = — - 1 ■ = 12,6 . 

log 6 

Der Würfel muß also mindestens 1 3-mal ausgespielt werden, 
damit die Wahrscheinlichkeit, wenigstens eine 6 zu er- 
halten, nicht unter 0,9 liegt. 

1.8.6 a) Aus einer mit N Kugeln gefüllten Urne werden 
n Kugeln mit Zurücklegen gezogen. Wie groß ist die Wahr- 
scheinlichkeit dafür, daß wenigstens eine Kugel mehrfach 
auftritt? 

b) Wie groß ist die Wahrscheinlichkeit dafür, daß in einer 
Gesellschaft von 30 Personen wenigstens zwei denselben Ge- 
burtstag haben (wenn man näherungsweise annimmt, daß sich 
die Geburtenhäufigkeit gleichmäßig über das ganze Jahr ver- 
teilt und außerdem von Schaltjahren abgesehen wird)? 



Lösung : 

a) Wir denken uns die Kugeln in der Urne von 1 bis N 
numeriert. Die Ergebnismenge ft beim n-maligen Ziehen mit 
Zurücklegen ist die Menge aller n-Tupel (i^ , i^ , . .., i R ) 

die sich aus den Zahlen 1, 2, ..., N bilden lassen, und 
es gilt | ft | = N n . A sei das Ereignis, daß wenigstens 
eine Kugel mehrfach auftritt. Das Komplement Ä ist dann 
das Ereignis, daß alle n gezogenen Kugeln verschieden 
sind. Ä besteht also aus allen n-Tupeln ohne Wiederho- 
lungen, die sich aus den Zahlen 1, 2, ..., N bilden las- 

sen; es gilt daher 

| Ä | = N (N-1 ) • • • (N-n+1 ) 

(Vgl.A 1.2.5 ). Da das Ziehen mit Zurücklegen ein symmetri- 
sches Zufallsexperiment ist, folgt 
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W(Ä) = ÜL = N -(- N -. 1 i--’V (N-n+.V d . h . 

. |»| N n 

W(A) = - N(N-1) (N-n+1) 

N n 

b) Unter den obigen vereinfachenden Annahmen ergibt sich 
die gesuchte Wahrscheinlichkeit nach der in a) erhaltenen 
Formel mit N = 365 und n = 30 



W(A) 



365 



364 



365 



30 



336 



Wir berechnen 



log (365 • 364 



336) 



log 



365! 

335! 



= log 365! - log 335! 

= 778,39975 - 702,06308 
= 76,33667 

log 365 30 = 30- log 365 = 30-2,56229 = 76,8687 



log 



365-364 

365 



30 



336 



log (365-364- • -336) - log 365 30 
76,33667 - 76,8687 



= 0,46797 - 1 



und erhalten 



365 



364 



365 



30 



336 



0,29 



und daraus 

W (A) = 1 - 0,29 = 0,71 . 

Die Wahrscheinlichkeit dafür, daß von 30 Personen mindestens 
zwei denselben Geburtstag haben, ist (näherungsweise) 0,71 . 
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2. Zufallsvariablen 



2.1 Zufallsvariablen und Funktionen 
von Zufallsvariablen 



2.1.1 Jede auf der Ergebnismenge eines Zufallsexperiments 
definierte reellwertige Funktion wird als Zufallsvariable 
bezeichnet. Eine Zufallsvariable ordnet also jedem mögli- 
chen Ergebnis des betrachteten Zufallsexperiments eine reelle 
Zahl zu. Wenn man X als Symbol für eine Zufallsvariable 
verwendet, bezeichnet man die reelle Zahl, die einem Ergeb- 
nis e durch X zugeordnet wird, mit X(e) . 

Die vorangehende Definition ist völlig unproblematisch, wenn 
die Ergebnismenge eines Zufallsexperiments endlich ist. Wegen 
der Schwierigkeiten, die unendliche Ergebnismengen mit sich 
bringen, verweisen wir auf die Literatur, insbesondere auf 
FISZ (1973) , S. 48 ff. 

2.1.2 Beispiele: a) Ein Roulettespieler habe den Betrag 1 

auf Rot gesetzt. Man zahlt ihm den Betrag 2 aus, falls die 
anschließend vorgenommene Ausspielung eine rote Zahl liefert; 
und man zahlt ihm nichts aus, wenn eine schwarze Zahl oder 
die Null ausgespielt wird. Wenn der Gewinn dieses Spielers 
mit X bezeichnet wird, gilt also 



X (e) 



1 falls e eine rote Zahl ist 
-1 sonst. 



X ist offensichtlich eine Zufallsvariable. 

b) Die beim Ausspielen eines Würfels auftretende Augenzahl 
X ist eine Zufallsvariable. Durch X werden nämlich den 
Ergebnissen 1, 2, ..., 6 des im Würfeln bestehenden Zufalls- 

experiments die Zahlen 
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X ( 1 ) 



1, X ( 2 ) = 2 , 



X (6 ) = 6 



zugeordnet . 

c) Wir spielen einen Würfel zweimal aus und bezeichnen mit 
X die auftretende Augensumme 

X(i,j) = i + j für i,j = 1 , 2, . .., 6. 

X ist offensichtlich eine Zufallsvariable. 

2.1.3 Mit Hilfe von Zufallsvariablen lassen sich in nahe- 
liegender Weise Ereignisse beschreiben. 

Nehmen wir an, X sei eine auf der Ergebnismenge ft eines 
Zufallsexperiments definierte Zufallsvariable. Wenn x irgend- 
eine reelle Zahl ist, ist die Menge 

{e e ft : X(e) = x} 

für die wir auch kurz 

{X = x} 

schreiben wollen, eine Teilmenge von ft - ein Ereignis also. 
Wenn bei der Durchführung des Zufallsexperiments {X = x} 
eingetreten ist, nennt man x Realisation oder Wert von X . 
Ist X etwa die beim zweimaligen Ausspielen eines Würfels 
auftretende Augensumme (vergl. Beispiel c) , so hat man z. B. 

{x = 3> = {.(1,2) , (2,1)} 

{X = 4} = { (1,3) , (2,2) , (3,1)]. 

Ergibt eine Durchführung des Zufallsexperiments das Augen- 
paar (3,1) , so hat die Augensumme bei dieser Durchführung 
die Realisation 4 . 

2.1.4 Wenn X eine Zufallsvariable ist, sind natürlich 
auch die Mengen 
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{x > a} = {e e ß : X(e) > a} 

{a < X < b} = {e e Q : a < X(e) < b} 

Ereignisse, gleichgültig wie man die reellen Zahlen a und b 
mit a < b vorgibt. An Stelle von 

W({X = a}) , W({X > a}) , W({a < X < b}) 

schreibt man oft kürzer 

W(X = a) , W(X > a) , W(a < X < b) . 

Wir kommen auf das vorangehend behandelte Beispiel c) zurück 
und bezeichnen mit X die beim zweimaligen Ausspielen eines 
echten Würfels auftretende Augensumme . Dann gilt beispiels- 
weise 



W(X > 11) 



3 

~ 36 



denn es ist erfüllt 

(x > 11 } = { (5,6) , (6,5) , (6,6) } . 



Wegen 



{X = 6} = 1(1,5), (2,4), (3,3), (4,2), (5,1)} 



hat man weiter 



W(X = 6) 



_5_ 

36 ’ 



2.1.5 Wir nehmen wieder an, jemand setze beim Roulettespiel 
den Betrag 1 DM auf Rot und es gelte für seinen Gewinn X 



( 1 falls e eine rote Zahl bezeichnet 

X (e ) = i 

^ -1 sonst. 

Wenn V die Auszahlung an den Spieler ist, hat man offen- 
sichtlich 
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f 2 falls e eine rote Zahl bezeichnet 

V (e) =<\ 

|^0 sonst . 

Es gilt also 

V(e) = X(e) + 1 für alle e e ft . 

Wir schreiben dafür kurz 

V = X + 1 . 

Nun sei Z die Auszahlung an den Spieler, jetzt aber in 
Pfennigen. Dann gilt 

Z(e) = 100 V (e) = 100 X(e) + 100 für alle e 
bzw. in abgekürzter Schreibweise 
Z = 100 V = 100 X + 100 . 

Die Zufallsvariablen V und Z sind mit Hilfe der Zufalls- 
variablen X definiert; sie sind Funktionen der Zufallsva- 
riablen X , wie man auch sagt. Vielfach definiert man von 
mehreren Zufallsvariablen ausgehend eine weitere Zufallsva- 
riable. Sind X und Y Zufallsvariablen auf der Ergebnis- 
menge n eines Zufallsexperiments und ist u(x,y) eine 
reellwertige Funktion, so wird die Zufallsvariable, die dem 



Ergebnis 


e e 


die Zahl 










u (X (e) , Y (e ) ) 






zuordnet , 


mit 


u (X , Y ) bezeichnet, 


, Speziell für 


u (x,y ) = x + y 


bzw. u(x 


,y) - 


: xy erhält man die 


Summe X + Y 


und das Pro- 


dukt XY 


der 


Zufallsvariablen X 


und Y . 





Für die Addition und Multiplikation von Zufallsvariablen 
gelten die üblichen Rechengesetze (Kommutativ-, Assoziativ- 
und Distributivgesetz) . Zum Beispiel gilt für beliebige Zu- 
fallsvariablen X, Y, Z 
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(X + Y) Z = XZ + YZ 



da für jedes Ergebnis e e ft erfüllt ist 

[ X (e ) + Y (e) ] Z(e) = X (e) Z(e) + Y(e) Z(e). 



2.2 Unabhängige Zufallsvariablen 

2.2.1 Zwei Zufallsvariablen X und Y heißen unabhängig s 
wenn für beliebige Zahlen x und y gilt 

W(X < x , Y < y) = W (X < x) VI (Y < y) . (1) 

Bezeichnen F (x) und G(y) die Verteilungsfunktionen von X 
und Y , so sind die beiden Zufallsvariablen also genau dann 
unabhängig, wenn gilt 

W(X < x , Y < y) = F (x) G (y ) x,y e IR . 

Ist diese Gleichung nicht für alle x und y erfüllt, so 
heißen X und Y abhängig . 

Sind die Zufallsvariablen X und Y unabhängig, so gilt 

auch 

W(X > x , Y > y) = W(X > x) W(Y > y) x,y e (R . 

Das folgt aus { X < x} = {x > x} , {y < y} = {y > y} und 

Aufgabe 1.8.3. 

X und Y seien Zufallsvariablen. Mit beliebigen Zahlen 
x^ < x 2 / y-j < y 2 gilt dann 

W(x 1 < X < x 2 , y 1 < Y < y 2 ) 

= W (X < x 2 , y., < Y < y 2 ) - W (X < Xl , y 1 < Y < y 2 ) 

= W (X < x 2 , Y < y 2 ) - W(X < x 2 , Y < y 1 ) 

- [W(X < x 1 , Y < y 2 ) - W(X < x 1 , Y < y 1 ) ] . 
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Sind X und Y unabhängig, so folgt weiter 



W(x 1 < X < x 2 , Yl < Y < y 2 ) 

= W(X < x 2 ) W (Y < y 2 ) - W (X < x 2 ) W (Y < y 1 ) 

- W(X < x 1 ) W (Y < y 2 ) + W (X < x 1 ) W(Y < y 1 ) 

= [ W (X < x 2 ) - W (X < Xl )] [ W (Y < y 2 ) - W (Y < Yl ) ] . 

Für unabhängige Zufallsvariablen X und Y und beliebige 
x^ < x 2 , y,| < y 2 gilt demnach 

W(x 1 < X < x 2 , Yl < Y < y 2 ) = W(x 1 < X < x 2 ) W( Yl < Y < y 2 ) (2) 



2.2.2 Betrachten wir das Ausspielen eines Rouletterades und 
eines idealen Würfels, ein Zufallsexperiment also, das aus 
Teilexperimenten mit den Ergebnismengen 

J2 1 = {0, 1, 36} bzw. ü 2 = {1, 2, 6} 

besteht. Wir definieren Zufallsvariablen X und Y auf 
ft = x ^ 2 

( 1 falls i eine von 0 verschiedene 
gerade Zahl ist 

-1 sonst , 

Y(i,j) = j . 

X ist also der Gewinn eines Spielers, der eine Einheit auf 
"Gerade" (Pair) setzt, und Y ist die beim Würfeln auftre- 
tende Augenzahl. Man hat beispielsweise 



II 

X 


= { (i,j) : i = 2, 4, .. 


36 ; j = 1, 2, . 


6} 


{Y = 3} 


= { (i,3) : i = 0, 1 , . . 


.,36} . 





Mit 

A 1 = {2, 4, 36} 

A 2 = {3} 
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gilt also 



{X = 1 } = A 1 x tt 2 

{Y = 3} = fi 1 x A 2 . 

Ob { X = 1 } eintritt, entscheidet sich demnach beim ersten 
Teilexperiment; ob {y = 3} eintritt, beim zweiten. 

Was vorangehend für { X = 1 } und {y = 3} gezeigt wurde, 
gilt selbstverständlich für jedes beliebige Paar von Ereig- 
nissen {x = x} und {y = y} . Wir wollen uns überlegen, 
daß X und Y wegen dieser Eigenschaft unabhängig sind. 
Dazu betrachten wir für beliebige x und y das Ereignis 

{X < x , Y < y} . 

Nach unseren Überlegungen existieren und 

mit 

{x < x} = B ^ x ^2 

{y < y} = ß 1 X b 2 . 

Wegen der Unabhängigkeit der Teilexperimente gilt dann 

W(X < x) = VI (B^) W (fi 2 ) = W (B 1 ) 

W (Y < y) = W^) W(B 2 ) = W(B 2 ) . 

Andererseits ist erfüllt 

{X < x , Y < y} = B^ x B 2 , 

so daß wegen der Unabhängigkeit der Teilexperimente folgt 
W(X < x , Y < y) = W(B 1 ) W(B 2 ) . 

Wegen (3) und (4) erhält man hieraus (1) , was die Un- 
abhängigkeit von X und Y beweist. 

2.2.3 Betrachten wir nun allgemeiner ein Zufallsexperiment, 
das sich aus zwei unabhängigen Teilexperimenten mit den Er- 
gebnismengen ft i bzw. ft 2 zusammen setzt (vgl. 1.2). X und 



(3) 

(4) 
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Y seien Zufallsvariablen auf der Ergebnismenge ß = x 
des Gesamtexperiments; X sei allein vom Ergebnis des ersten 
und Y allein vom Ergebnis des zweiten Teilexperiments ab- 
hängig, so daß man für 

e, e' e f, f' £ 



hat 



X (e , f ) = X (e , f ' ) 

Y(e,f) = Y (e ' , f ) . 

Dann sind X und Y unabhängig. Man beweist dies durch die 
naheliegende Verallgemeinerung der Überlegungen von 2.2.2 . 

2.2.4 Angenommen, man interessiert sich für mehr als zwei 
Zufallsvariablen X, Y, ..., Z . Man nennt X, Y, ..., Z 
unabhängig , wenn für beliebige x, y, . . . , z erfüllt ist 

W (X < x , Y < y , . . . , Z < z) = W (X < x) W(Y < y) . . . W(Z < z) . 

Die Zufallsvariablen X^ , X 2 , ..., X n seien auf der Ergeb- 
nismenge eines Zufallsexperiments definiert, das aus n Teil- 
experimenten besteht. Der Wert der Zufallsvariablen X^ wer- 
de allein durch das Ergebnis des 1. Teilexperiments, der von 
X 2 allein durch das Ergebnis des 2. Teilexperiments, ... 
und der von X R allein durch das Ergebnis des n-ten Teilex- 
periments bestimmt. Dann sind die Zufallsvariablen 
X-j , X 2 , X n unabhängig. Dies folgt aus der naheliegen- 

den Verallgemeinerung der Beweisführung in 2.2.2 . 

Nehmen wir beispielsweise an, man spiele einen Würfel n-mal 
aus und bezeichne mit X^ , X 2 , . . . , X n die beim 
1 . , 2. , . . . ., n-ten Wurf auftretende Augenzahl . Dann 
sind X^ , X 2 , ..., X^ unabhängige Zufallsvariablen, weil 
die einzelnen Würfe unabhängige Zufallsexperimente sind und 
die Beobachtung für X^ ausschließlich durch den i-ten 
Wurf festgelegt wird (i = 1 , 2, . . . , n) . 
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2.3 Masse-, Dichte- und Verteilungsfunktionen 



2.3.1 X sei eine Zuf allsvariable . Wir nehmen an, es gebe 
endlich viele x^ , x^, . . . , x^ mit 

W(X = ) > 0 für i = 1, 2, ..., I , 

I 

l W (X = x. ) = 1 
i = 1 1 

Dann bezeichnet man X als diskrete Zuf alls variable und 
x^ , x^ / . .., x^ als Ausprägungen von X . 

Wenn X eine diskrete Zuf allsvariable ist, nennt man die 
Funktion 

f(x) = W ( X = x) , x e R 

Mas se funkt ion von X . Sind x^ , x ^ , ..., x^. die Ausprägun- 

gen von X , so hat man 

f(x^) > 0 für i = 1, 2, ..., I 
f (x) = O für alle x ^ x^ , x ^ , . .., Xj . 



Nehmen wir beispielsweise an, X sei die beim Ausspielen 
eines idealen Würfels auftretende Augenzahl. Dann gilt 



f (x) = W (X = x) 




für x 
sonst . 



2 , 



6 



Also ist X eine diskrete Zufallsvariable mit den Ausprä- 
gungen 1 , 2 , . . . , 6 . 
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2.3.2 In zahlreichen Anwendungs fällen beschreibt man eine 
diskrete Zufallsvariable X in folgender Weise: Man gibt 
die Menge X der Ausprägungen von X an, ferner zu jedem 
x e X die Wahrscheinlichkeit dafür, daß die Zufallsvariable 
X die Ausprägung x annimmt. Eine Tabelle, in der neben 
den möglichen Ausprägungen die zugehörigen Wahrscheinlich- 
keiten notiert sind, heißt Wahre eheinlichkeitstabelle von X . 
Wenn x^ , , ..., x^ die Ausprägungen von X sind, hat sie 

folgendes Aussehen 



X . 
1 


W({x = X ± } ) 


X 1 


W({x = Xl }) 


X 2 


W({x = x 2 }) 


. 

X I 


W({x = Xj.} ) 



2.3.3 Wenn X eine beliebige Zufallsvariable ist, nennt 
man die Funktion 

F (x) = W(X < x) , x e IR 

Verteilungsfunktion von X . 

Nehmen wir an, X sei eine diskrete Zufallsvariable mit 
den Ausprägungen x^, x 2 , ..., x J und der Massefunktion 
f (x) . Wenn für eine reelle Zahl x gilt 

x 1 , x 2 , x 3 < X 

X 4 ' X 5 ' * • • ' x i > x 

bilden die Ereignisse 



{x = x,}, {X = x 2 l, {x = x 3 } 
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eine Zerlegung des Ereignisses 



{X < x} 



so daß gilt 

W (X < x) = W(X = x ^ ) + W(X = x 2 ) + W (X = x 3 ) . 

Die letzte Gleichung ist gleichbedeutend mit der folgenden 
F ( x ) = f( Xl ) + f ( x 2 ) + f(x 3 ) . 

Allgemeiner gilt für beliebiges x 

F(X) = l f(x ) . 

x . <x 
1 = 

Die Verteilungsfunktion einer diskreten Zuf allsvariablen X 
ist daher eine monoton von 0 bis 1 steigende Treppen- 
funktion mit Sprungstellen bei den Ausprägungen 
x^ , x 2 , x^ von X . Die Sprunghöhe an der Stelle x^ 

ist gleich f(x i ) ; an der Stelle x^ gilt für die Vertei- 
lungsfunktion der größere der beiden in Frage kommenden 
Werte (i = 1, 2, ...,1) . Die Verteilungsfunktion der 

Augenzahl X beim Ausspielen eines echten Würfels lautet 
beispielsweise 

( 0 für x < 1 

^ für i < x < i + 1; i = 1, 2, 5 

1 für 6 < x . 

Sie ist in Abb . 6 dargestellt 
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0 1 2 3 4 5 6 7 

Abb. 6 

2.3.4 Wenn X eine beliebige Zufallsvariable ist und für 
reelle Zahlen x^ , x gilt x^ < , bilden die Ereignisse 

{x < X.,}, { Xl < X < X 2 } 

eine Zerlegung des Ereignisses 
{X < x 2 } . 

Es folgt 

W(X < x 2 ) = W(X < x 1 ) + W(x 1 < X < x 2 ) 

wofür wir nach Definition der Verteilungsfunktion F(x) von 
X auch schreiben können 

F(x 2 ) = F(x 1 ) + W(x 1 < X < x 2 ) . 

Aus der letzten Gleichung ist zu ersehen, daß die Verteilungs- 
funktion F (x) eine monoton wachsende Funktion ist. Man er- 
kennt weiter, daß die Wahrscheinlichkeit für das Auftreten 
eines Wertes aus dem Intervall (x^ , x 2 ] gleich 

F(x 2 ) - F( Xl ) 

ist . 
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2.3.5 Man nennt jede Funktion f mit den Eigenschaften 

f (x) > 0 für alle x 

+ 00 

f f ( x ) dx = 1 



Dichtefunktion. Beispielsweise ist also 



f (x) 



j für 0 < x < 2 
0 sonst 



eine Dichtefunktion. 

Nehmen wir nun an, man habe eine Zuf allsvariable X mit 
der Verteilungsfunktion F(x) und eine Dichtefunktion f (x) 
mit der Eigenschaft 



/ f (x) dx = F (x 



für alle x 

o 



Das bedeutet, daß zwischen der durch f (x) definierten Kurve 
und dem Abszissenintervall (-°°, x ] eine Fläche liegt, deren 
Inhalt gleich 



F(x q ) = W(X < x Q ) 
ist (vgl . Abb . 7 ) . 



f(x) 
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Unter diesen Voraussetzungen bezeichnet man f(x) als 
Dichtefunktion der Zufallsvariablen X . Eine Zufallsvariable, 
zu der eine Dichtefunktion existiert, wird stetige Zufalls- 
variable genannt. 



2.3.6 Angenommen, die Durchführung eines bestimmten Pro- 
duktionsprozesses liefere ein Objekt, dessen Länge X mit 
Sicherheit zwischen 4 und 6 mm liegt. Es gelte für be- 
liebige a, b e [ 4 ; 6 ] mit a < b 



W(a < X < b) 



b-a b-a 
6-4 2 



Dann ist X offensichtlich eine stetige Zufallsvariable; 
als Dichtefunktion erhalten wir 

für x e [ 4 ; 6 3 
sonst 




und als Verteilungsfunktion 



F (x) 



0 


für 




x < 


4 


* - 2 
2 


für 


4 


< X < 


6 


1 


für 


6 


< X . 





Die Funktionen f(x) und F(x) sind in Abb. 8 dargestellt. 

f(x) 

0,5- i 1 

| ! 

Ql 1 1 1 i 1 1 ' 1 X 

012345678 

F(x) 




Abb. 8 
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2.3.7 X sei eine stetige Zufallsvariable mit der Dichte- 
funktion f (x) und der Verteilungsfunktion F(x) . 
x q/ x^ seien beliebige Zahlen mit x q < . Aus 



F(x q ) = / f ( x ) dx 



F ( x^ ) = f f (x) dx 



folgt dann 



W (x < X < x.) = F(x.) - F ( x ) 
o—i 1 o 



1 

/ f (x) dx . 



Andererseits ist erfüllt 



W(X = x 1 ) < W(x < X < x 1 ) 

so daß man erhält 
W(X = x 1 ) < 

Die letzte Ungleichung gilt für beliebiges x q mit x q < x^ . 
Nun konvergiert 



1 

/ f (x) dx . 



x 



1 



X 



o 



f (x)dx 



gegen 0 , wenn x q gegen x^ strebt, und wir erhalten 



W(X = x 1 ) 



lim 

V* x 1 



x 

o 



f (x) dx = 0 . 
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Wir haben damit folgendes bewiesen: 

Wenn X eine stetige Zufallsvariable ist, gilt 

W(X = x ) = 0 für alle x e IR. 

Bei beliebigen a, b mit a < b hat man daher auch 

W(a < X < b) = W(a < X < b) 

= W (a < X < b) = W (a < X < b) . 



2.4* Gemeinsame Massefunktion zweier Zufalls- 
variablen 

2.4.1 X und Y seien diskrete Zufallsvariablen mit den 
Ausprägungen x^ , , . .., x-j. bzw. y^ , y 2 , ..., yj . Man 

nennt dann die Funktion 

h(x,y) = W(X = x, Y = y) 

gemeinsame Masse funktion von X und Y und eine Tabelle, 
die zu allen Paaren (x^y^) möglicher Ausprägungen die 
Wahrscheinlichkeiten h(x^,y^) enthält, gemeinsame Wahr- 
s cheinliehkeitstabelle . 



\y 


*1 


^2 


••• y j 


I 


x i 


h(x 1 ,y 1 ) 


h(x 1 ,y 2 ) 


... h (x 1 ,Yj) 


f (x 1 ) 


X 2 


h(x 2 ,y 1 ) 


h(x 2' y 2 ) 


... h(x 2 ,y J ) 


f (x 2 ) 


*1 


Mx^y^ 


h (Xj ,y 2 ) 


... h(x I ,y J ) 


f (x I ) 


I 


o (y t ) 


g(y 2 ) 


... g(yj) 


1 
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Die Summe aller I«J Werte in der gemeinsamen Wahrschein- 
lichkeitstabelle ist 1 , da die Ereignisse 

A ij = l x = x iM {* = y-j } 

i — 1 » 2 , • • • , I; j = 1 , 2 , . . . , J 

eine Zerlegung von bilden. 

Eine gemeinsame Wahrscheinlichkeitstabelle erweitert man 
meist um eine Summenspalte und eine Summenzeile, in denen 
die Werte der Massefunktionen f (x) und g(y) von X bzw. 

Y stehen. Da die Ereignisse A . . , A. 0 , A._ eine Zer- 

legung des Ereignisses {x = x^} bilden, gilt nämlich für 
i = 1 , 2, . . . , I 

f(x i ) = h(x i ,y 1 )+h(x i ,y 2 )+. . .+h(x i ,y J ) . 

Entsprechend hat man für j =1, 2, ..., J 

g (y j ) = h (x 1 ,yj)+h(x 2 / y^)+. . . +h (Xj ,y j ) . 

Die Werte der Massefunktionen von X und Y erscheinen 
auf diese Weise am Rande der gemeinsamen Wahrscheinlichkeits- 
tabelle; sie werden deshalb auch Rand- oder Marginalwahrschein- 
lichkeiten genannt. 

2.4.2 Beispiel: Ein echter Würfel wird einmal ausgespielt. 

X sei die auftretende Augenzahl 

X(i) = i für i = 1, 2, ..., 6 . 

Eine zweite Zuf allsvariable Y sei definiert durch 



für 


i = 2, 4, 


6 


für 


i = 1 / 3 , 


5 
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X und Y 



besitzen die Massefunktionen 



f (x) 



\ für x=1, 2, 6; 

D 

0 sonst, 



g(y) 



J für y = 0, 1 ; 
0 sonst . 



Um die Werte der gemeinsamen Massefunktion h(x,y) zu er- 
halten, haben wir für i = 1, 2, . .., 6; j = 0, 1 die 

Wahrscheinlichkeiten der Ereignisse 



{x = i} A {y = j} 



zu bestimmen. Wegen 



{X = 1 }A {Y = 0 } = { 1 } A { 2 , 4 , 6 } =0 

gilt z. B. h(1, 0) =0 und aus 

{X = 1 } A {Y = 1 } = { 1 } a { 1 , 3 , 5 } = { 1 } 

folgt 



h ( 1 , 1) =| . 

So ergibt sich für X und Y folgende gemeinsame Wahr- 
scheinlichkeitstabelle 



\ y 

X X. 


0 


1 


I 


1 


0 


1/6 


1/6 


2 


1/6 


0 


1/6 


3 


0 


1/6 


1/6 


4 


1/6 


0 


1/6 


5 


0 


1/6 


1/6 


6 


1/6 


0 


1/6 


l 


1/2 


1/2 


1 
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2.4.3 X und Y seien unabhängige diskrete Zufallsvariablen 
mit den Massefunktionen f (x) bzw. g(y) und mit der ge- 
meinsamen Massefunktion h(x,y). Dann gilt 2.2.1 (2). Er- 
setzen wir dort x 2 und x-j durch x bzw. x - e und 
y 2 un< ^ Y -j durch y bzw. y - e, wobei e > 0 voraus- 
gesetzt wird, so erhalten wir 



W ( x - e < X < x , y - e < Y < y ) 



= W(x - £ < X < x) W (y - e < Y < y) 

Wegen 



lim W ( x - e <X < x) = w ( X = x) 
e+0 

lim W(y - e < Y < y) = W(Y = y) 
e-K) 

lim W(x - e < X < x, y - e < Y < y) = W (X = x, Y = 
e->0 



folgt hieraus 



W(X = x, Y = y) = W (X = x) W(Y = y) 



wofür wir auch 



h (x,y) = f ( x ) g (y ) 



y) 



schreiben können. 

Wenn X und Y unabhängige Zuf allsvariablen mit den Masse- 
funktionen f(x) bzw. g (y ) sind, gilt demnach für die 
gemeinsame Massefunktion h(x,y) von X und Y 

h(x,y) = f ( x ) g (y ) . 

Insbesondere ist erfüllt 

Mx^y^) = f(x ± ) g(Yj) 
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für alle Ausprägungen , x 2 , . . . , x I und y^, y 2 , . . . / yj 
von X bzw. Y . 

2.4.4 Die für 2 Zufallsvariablen angestellten Überlegun- 
gen lassen sich verallgemeinern. Wenn X^, X 2 , ..., X^ 
diskrete Zufallsvariablen sind, heißt die Funktion 

h(x 1f x 2 , ..., x k ) 

= W({x 1 = x r X 2 = x 2 , X k = x k }) 

gemeinsame Masse f Miktion von X^ , X 2 , ..., X^ . 

Aus der gemeinsamen Massefunktion h(x^, x 2 , ..., x^) der 
Zufallsvariablen X 1 , X 2 , ..., X k lassen sich Randwahr- 
scheinlichkeiten berechnen. Wenn )(\ die Menge aller Aus- 
prägungen von X^ ist und f^ die Massefunktion von 
X i (i = 1 , 2, . . . , k) , gilt beispielsweise für alle x^ e X-j 

f(x ) = W(X = x ) = l l ... I h(x 1 ,x 2 ,...,x k ) f 

x 2 e *2 X 3 e *3 X k eX k 



52 




2.5 Aufgaben 



2.5.1 Ein echter Würfel wird zweimal ausgespielt. X sei 
die Summe der beiden auftretenden Augenzahlen. 

a) Geben Sie die Wahrscheinlichkeitstabelle von X an. 

b) Berechnen und zeichnen Sie die Massefunktion und die 

Verteilungsfunktion von X . 

Lösung : 

a) Das zweimalige Ausspielen eines echten Würfels ist ein 
symmetrisches Zufallsexperiment mit der Ergebnismenge 

= {(i-j) : i,j = 1, 2, 6}. 

Die Augensumme X ordnet jedem Ergebnis (i,j) die Zahl 

i + j zu. X ist eine diskrete Zuf allsvariable mit den 

Ausprägungen 2, 3, ..., 12 . Die Wahrscheinlichkeit, mit 
der X den Wert x (x = 2, 3, ..., 12) annimmt, ist gleich 
dem Quotienten aus der Anzahl aller Ergebnisse (i,j) mit 
i + j = x und der Anzahl jfi| aller möglichen Ergebnisse. 
Es gilt |ft| =36 . Die Anzahl der Ergebnisse (i,j) mit 
i + j = x entnehmen wir einer Wertetabelle, in der für je- 
des Ergebnis (i,j) die Summe i + j notiert ist. 
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Wir erhalten für X die folgende Wahrscheinlichkeitstabelle 



X 


W (X=x) 


2 


1/36 


3 


2/36 


4 


3/36 


5 


4/36 


6 


5/36 


7 


6/36 


8 


5/36 


9 


4/36 


10 


3/36 


1 1 


2/36 


12 


1/36 



b) Die Massefunktion f(x) der Zufallsvariablen 



f ( x ) = 



F (x) = 



1/36 


für 


X 


= 


2/12 


2/36 


für 


X 


= 


3/11 


3/36 


für 


X 


= 


4/10 


4/36 


für 


X 


= 


5,9 


5/36 


für 


X 


= 


6/8 


6/36 
^ 0 


für 


x = 7 
sonst . 


»ilungs funkt ion 


F (x) erhalten 


f 0 


für 




X 


< 2 


1/36 


für 


2 


< 


x < 3 


3/36 


für 


3 


< 


x < 4 


6/36 


für 


4 


< 


x < 5 


10/36 


für 


5 


< 


x < 6 


15/36 


für 


6 


< 


x < 7 


21/36 


für 


7 


< 


x < 8 


26/36 


für 


8 


< 


x < 9 


30/36 


für 


9 


< 


x < 10 


33/36 


für 


10 


< 


x < 11 


1 35/36 


für 


1 1 


< 


x < 12 


V 1 


für 




X 


> 1 2 ♦ 



X lautet 
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2.5.2 Eine Rouletteausspielung führt zu einer der Zahlen 
0, 1, 2, . .., 36 . Von den ungeraden Zahlen 1, 3, . .., 35 
sind insgesamt 10 (darunter die Zahl 1) rot; unter den 
geraden Zahlen 2, 4, . .., 36 befinden sich 8 rote Zah- 
len. Jemand setzt nun je eine Spielmarke auf Rot, Gerade 
und 1 . X sei der Betrag, den die Bank ihm nach der Aus- 
spielung zahlt. Geben Sie die Wahrscheinlichkeitstabelle 
von X an . 

Lösung : 

Der Spieler setzt eine Marke auf die Zahl 1 und erhält 
dafür, wenn sich bei der Ausspielung diese Zahl ergibt, den 
36-fachen Einsatz zurück. Eine weitere Marke wird auf Rot 
gesetzt. Dafür zahlt im Gewinnfalle die Bank dem Spieler 
den doppelten Einsatz zurück. Ebensoviel gewinnt der Spieler 
mit der dritten gesetzten Marke, wenn die Ausspielung eine 
(von 0 verschiedene) gerade Zahl ergibt. Der Spieler erhält 
folglich immer dann Geld zurück, wenn die 1 , eine rote 

oder eine gerade Zahl gewinnt. Er zieht sogar aus zwei 
Spielmarken Gewinn, wenn die Ausspielung eine gerade rote 
Zahl oder die 1 ergibt (denn 1 ist eine rote Zahl) . 

Für die Zufallsvariable X gilt daher 

38 für i = 1 

4 für i gerade, rot 

für i gerade, schwarz oder 

ungerade, rot, f 1 

sonst . 

Da es 8 gerade rote, 10 gerade schwarze und 9 von der 
1 verschiedene ungerade rote Zahlen gibt, lautet die Wahr- 
scheinlichkeitstabelle von X 




56 





2.5.3 Die Zuf allsvar iable X besitze eine Dichtefunktion 

der Gestalt 

f ax für 0 < x < 1 
f(x) = < 

' 0 sonst . 

a) Bestimmen Sie die Konstante a . 

b) Berechnen Sie die Verteilungsfunktion von X . 

c) Zeichnen Sie die Dichtefunktion und die Verteilungs- 
funktion von X . 

d) Mit welcher Wahrscheinlichkeit nimmt X Werte größer 
als 0,5 an? 

e) Für welche Zahl c nimmt X mit der Wahrscheinlich- 
keit 0,5 Werte an, die größer als c sind? 

Lösung : 
a) Es gilt 



+ 0° 1 

/ f(x)dx = I axdx 
0 




1 

0 



a 

2 



Wegen 



folgt 



/ f(x)dx = 1 



a = 2 . 



b) Für die Verteilungsfunktion F(x) von X gilt 



F ( x ) = f f ( y ) dy 



x e R . 



Wir erhalten F(x) = 0 für x < 0 , F(x) = 1 für x > 1 



F (x) = / 2ydy 

0 



= y 



x für 0 < x < 1 



und 
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also 



f 0 für 

F(x) = S X 2 für 

V 1 für 

c) Die Dichtefunktion und die Verteilungsfunktion von X 

sind in Abb. 10 gezeichnet 



x < 0 

O < x < 1 

x > 1 . 



Abb. 10 




d) Die Ereignisse {X > 0,5} und {x < 0,5} sind komple- 
mentär; daher hat man 



W(X > 0,5) = 1 
= 1 



W(X < 0,5) 

F (0 , 5 ) = 1 - 0, 5 2 = 0,75. 



e) Zur Bestimmung der Zahl c mit 



W(X > c) = 0,5 



betrachten wir 

F ( c) = W(X < c) = 1 - W(X > c) = 0,5 . 

Da jedenfalls 0 < c < 1 erfüllt ist, haben wir 

d. h. 
d. h. 



F (c) = c 2 
c 2 = 0,5 

c = /0 , 5 = 0,707- 
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3. Momente von Zufallsvariablen 



3.1 Erwartungswert einer diskreten Zufallsvariablen 



3.1.1 X sei eine diskrete Zufallsvariable mit den Ausprä- 
gungen x^, x 2 , •••/ und der Massefunktion f (x) . Wir 

wiederholen das Zufallsexperiment, auf dessen Ergebnismenge 
X definiert ist, n mal. Die Ausprägung x^ trete dabei n^- 
mal auf (i = 1, 2, ..., I). Das arithmetische Mittel der 

beobachteten Werte ist dann gleich 



I 



l 



x . n . 



i i 



n 



I 

I 

i=1 



n . 



( 1 ) 



Nach 1.4 tendieren die relativen Häufigkeiten 
n^/n, n 2 /n, ..., n^/n nach den Wahrscheinlichkeiten 

fCx^), f (x 2 ) , ..., f(x I ) . Das arithmetische Mittel (1) 

tendiert also gegen 

l X f(x .). 

i=1 

Dieser bei häufiger Durchführung des zugrundeliegenden Zu- 
fallsexperiments näherungsweise beobachtete Durchschnitts- 
wert heißt Erwartungswert EX der Zufalls variablen X: 



I 

EX = l x f(x ) . 

i=1 
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Der Erwartungswert einer diskreten Zufallsvariablen ist also 
das mit den zugehörigen Wahrscheinlichkeiten gewogene arith- 
metische Mittel der Ausprägungen dieser Zufallsvariablen. 

Für die beim Ausspielen eines echten Würfels auftretende 
Augenzahl X beispielsweise gilt 

EX = £ i -^=^(1+2+3+4+5+6) =3,5 . 

Bei häufiger Ausspielung des Würfels wird sich demnach als 
durchschnittliche Augenzahl etwa 3,5 ergeben. 

3.1.2 Beispiel: X sei eine diskrete Zufallsvariable mit 

der Wahrscheinlichkeitstabelle 



X 


f (x) 


-1 


1 


4 


0 


3 

8 


1 


3 


8 



Dann gilt 

EX = (-1) . i + 0 • | + 1 • | = -1 . 

Nun interessiere man sich für die Zufallsvariable 



Wenn X den Wert 0 annimmt, nimmt Y ebenfalls den Wert 
0 an; Y ist gleich 1 , wenn X den Wert -1 oder den 

Wert +1 annimmt. Y besitzt also die folgende Wahrschein- 
lichkeitstabelle 
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y 


g(y) 




3 


0 


8 




5 


1 


8 



und den Erwartungswert 

EY = 0 • I + 1 • I = f • 

3.1.3 X sei eine diskrete Zuf allsvariable mit den Ausprä- 
gungen , x 2 , x^ und der Massefunktion f(x) . u(x) 

sei eine beliebige Funktion. Dann ist auch die Zuf allsvariable 

Y = u (X) 

diskret; sie kann offensichtlich nur die Werte 
u (x 1 ) , u (x 2 ) , . . . , u (Xj.) 

annehmen, die nicht alle voneinander verschieden sein müssen. 
Im Beispiel 3.1.2 hatten wir 

x ^ = — 1 , x 2 = 0, x 3 = 1 
u(x) = X 

und daher 

u (x 1 ) = u ( x 3 ) = 1 , u ( x 2 ) = 0 . 

Wenn y^ , y 2 / . . . , Yj die Ausprägungen von Y sind, ist 

definitionsgemäß erfüllt 

J 

EY = l y W(Y = y.) . 

j = 1 3 ^ 
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Nun gilt für mindestens eine der Zahlen i = 1, 2, . .., I 
u(x i ) = y 1 . 

Alle 1=1,2, . . . , I mit 
«(*!> = y-i 

fassen wir zur Menge zusammen. Entsprechend definieren 

wir A 2 , A^ t . .., Aj . Wir haben also für j = 1, 2, J 

A j = {i : «(x..) = Yj}. 

Die Mengen A^ , A^ f . .., Aj bilden eine Zerlegung der Menge 
{l, 2, . .., i} . In 3.1.2 beispielsweise hatten wir 

y 1 = °, y 2 = 1 und A i = {2}/ a 2 = { 1 r 3}. 

Nun betrachten wir die Summe 

I 

I u(x ) f(x ) . 

1 1 1 

W T egen der Zerlegungseigenschaft der Mengen A 1 , A 0 , . . . , A_ 

i z j 

kann sie in der Gestalt 
J 

l l u ( X . ) f(x ) 
j=1 ieAj 1 1 

geschrieben werden. Und weil für j = 1, 2, . .., J aus 
i e Aj folgt u(x^) = , ist sie gleich 

J 

l y i l fix L ) . 

j=1 3 i€A. 
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Wenn g(y) die Massefunktion von Y ist, ist der letzte 
Ausdruck gleich 

J 

I y-i W(A.) = l y. g(y .) = EY . 
j=1 3 3 3 3 

Damit haben wir bewiesen 

Eu(X) = l u(x ± ) f(x i ) . (2) 

3.1.4 Beispiel: Wir kommen auf Beispiel 3.1.2 zurück und 
nehmen an, X besitze die Wahrscheinlichkeitstabelle 



X 


f (x) 


-1 


1 


4 


0 


3 




8 


1 


3 


8 



Wir wollen den Erwartungswert der Zuf allsvariablen 



Y 



X 



2 



berechnen, ohne vorher die Massefunktion dieser Zufallsva- 

2 

riablen zu ermitteln. In (2) ist also u(x) = x zu 
setzen. Wir erhalten 



EY = 7 x. f (x. ) 

L l l 

k 2 



= (-1)' 



w 



l 4- I 2 



5 

8 



in Übereinstimmung mit dem Resultat von 3.1.2 . 



3.1.5 Jetzt seien X und Y diskrete Zufallsvariablen 
mit den Ausprägungen x^ , bzw. , y^, . . . , yj 
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u(x,y) sei eine beliebige Funktion. Dann ist 
u(X,Y) 

eine diskrete Zufallsvariable, und es gilt 
I J 

Eu(X,Y) = l l u(x ,y.) W(X = x , Y = y.). (3) 

i=1 j=1 J 3 

Man beweist die letzte Gleichung durch Überlegungen, die 
den in 3.1.3 durchgeführten völlig analog sind. 

3.1.6 X und Y seien diskrete Zufallsvariablen mit den 
Massefunktionen f(x) bzw. g(y) und mit den Ausprägungen 
x^ , x 2 , ..., x^. bzw. y 1# y 2 , ..., y . a, b und c seien 
beliebige Zahlen. Aus (3) folgt dann 

E (a + bX + cY) 

= ll (a + t>x ± + cy j ) W(X = x if Y = Yj) 
so daß man wegen der Linearität der Summenbildung erhält 

E(a + bX + cY) = all w < x = x ± / Y = Y j ) 

+ b Z x . Z W(X = x. , Y = y . ) 
i 1 j 1 3 

+ c Z y . E W(X = x ± , Y = y.). 

j J i 

Nun gilt 



I W(x = X ± , 

j 


y = y.) 


= W (X = x ± ) = f(x ± ) 


I W(x = X ± , 
i 


y = y j ) 


= W(Y = y j ) = g(y^) 


n = x.. 


Y = Yj) 


= 1 



und es ergibt sich 

E(a + bX + cY) = a + b^x^f(x^) + c^y^gCy^) 
= a + bEX + cEY . 
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Allgemeiner zeigt man für beliebige diskrete Zufallsvariablen 

X„ , X„, . .., X und beliebige Zahlen a , a„ , . .., a 

1 ' 2 n ^ o' 1 ' ' n 

E ( a + a X + ... + aX ) = a + a.EX. + ... + a EX . 
oll n n o 1 1 n n 

Wegen dieser Gleichung bezeichnet man die Erwartungswert- 
bildung als lineare Operation . 

3.1.7 Wir nehmen jetzt an, X und Y seien unabhängige 
diskrete Zufallsvariablen. Wir wollen zeigen, daß dann gilt 

EXY = EX EY . (4) 

Seien also f (x) bzw. g(y) die Massefunktionen und 
, x^ / . .., x^ bzw. y 1 , y 2 , . . . , yj die Ausprägungen 

von X und Y . Mit u(x,y) = xy folgt aus (3) 

EXY = H x ± Yj W (X = X i , Y = y j ) . 

Da wegen der Unabhängigkeit von X und Y 

W (X = x i , Y = y_. ) = ffx^ g(y^) 

für i = 1, 2, ..., I und j = 1, 2, ..., J gilt, ergibt 

sich hieraus 

EXY = H x ± f(x i ) g ( Y j ) 

= I x i f < x i> l Yj 9(y-j> • 

Die Behauptung (4) folgt unmittelbar. 
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3.2 Erwartungswert einer stetigen Zufallsvariablen 



3.2.1 X sei eine stetige Zufallsvariable mit der Dichte- 
funktion f(x) . Dann bezeichnet man 

EX = / xf (x) dx 

— 00 

als Erwartungswert von X , sofern die Funktion xf (x) ab- 
solut integrierbar ist, d. h. 

/ | x | f (x) dx < 00 e 



Nehmen wir beispielsweise an, X besitze die Dichtefunktion 



f ( 



*'■ t 



I j für 0 < x < 2 



0 sonst 



dann gilt 



/ xf(x)dx = / rr dx = 1 
0 z 



X besitzt also den Erwartungswert 1 . 



3.2.2 Während nach unserer Definition in 3.1.1 jeder 
diskreten Zufallsvariablen ein Erwartungswert zugeordnet 
ist, gibt es stetige Zufallsvariablen, die keinen Erwar- 
tungswert besitzen. Nehmen wir beispielsweise an, X be- 
sitze die Dichte 



f (x) 



0 für x < 1 



2x 3 / 2 



für x > 1 . 
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Dann hat man 



+ 00 + 00 00 

I |x| f(x)dx = f xf(x)dx = / — — = oo 

-°° 1 1 2/x 

so daß X keinen Erwartungswert besitzt. 

Aussagen über Erwartungswerte stetiger Zufallsvariablen 
betreffen notwendigerweise ausschließlich Zuf allsvariablen 
mit existierenden Erwartungswerten. Auf diesen Tatbestand 
wollen wir im folgenden nur gelegentlich hinweisen. 

(Vgl. 3.3.3 ) 

3.2.3* Wir wollen uns überlegen, wie man von der Definition 
des Erwartungswerts einer diskreten Zufallsvariablen ausge- 
hend zu der vorangehend angegebenen Definition für stetige 
Zufallsvariablen gelangt. Dabei gehen wir der Einfachheit 
halber aus von einer Zuf allsvariablen X , deren Dichte- 
funktion f(x) außerhalb eines Intervalls [ a,b] den Wert 
0 haben und auf dem Intervall [ a,b] monoton wachsen soll. 
Wir wählen eine natürliche Zahl n und setzen 




und für m = 0, 1, 2, ..., 2 n 



x = a + m d 
m 

sowie für m = 1 , 2 , . . . , 2 n 



w 



m 



x 

m 

/ 



f(x)dx . 



Außerdem definieren wir Zufallsvariablen X + und X , und 
zwar wie folgt 
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X + (e) = x falls X(e) e (x x ] 

m m- 1 m 

X_(e) = x m-1 falls X(e) e ( x m- 1 ' x m 

Offensichtlich gilt dann für alle e e ft 

x"(e) < X (e) < X + (e) . 

In der folgenden Abb. 11 ist n = 2 zugrundegelegt. 




Definitionsgemäß hat man 



EX + = 7 x 

H TT 



ex = y x , 

tj 1 m-1 



Da wegen der Monotonie von f(x) 

d,f(x m-1 ) ^ w m ^ d - f(x m ) 
gilt, folgt 

EX + < d y x f(x ) 

= L m m 

EX" > d y x^_ -| f ( x^_ -• ) = d [ yx m f(x m ) + af (a) - bf(b)] . 
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Nun ist erfüllt 



b 

lim d £ x f(x ) = / xf(x)dx 
m a 

lim d [ af (a) - bf (b) ] =0 

n->°° 

so daß sich ergibt 
lim EX + 

lim EX" 

n^oo 

Sollte man dann der Zufallsvariablen X nicht die Zahl 

b « 

/ xf(x)dx = f xf(x)dx 
a -°° 

als "Erwartungswert" zuordnen? 

3.2.4 Für die Erwartungswerte stetiger Zufallsvariablen 
gelten Aussagen, die den für diskrete Zufallsvariablen be- 
wiesenen völlig analog sind. Insbesondere hat man für belie- 
bige stetige Zufallsvariablen X^ , , ..., X n und reelle 

Zahlen a . a- , . . . , a 

o' 1 n 

E(a + a.X. + ... + a X ) = a + a.EX. + ... + a EX 
oll n n o 11 n n 

Einen Beweis dieser Aussage findet man beispielsweise bei 
FISZ (197 3) , S. 106 ff. 



b 

= / xf (x) dx 
a 

b 

= f xf (x) dx . 
a 
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3.3 Varianz 



3.3.1 Die Wahrscheinlichkeitsverteilung einer Zufallsvariablen 
X läßt sich für viele Zwecke ausreichend charakterisieren 
durch den Erwartungswert und eine zweite Kennzahl, die an- 
gibt, wie stark die Realisationen der Zufallsvariablen um 
ihren Erwartungswert streuen. Als zweckmäßigstes Maß für 

die Streuung erweist sich der Erwartungswert der Zufallsva- 
2 

riablen (X - EX) , der als die Varianz von X bezeichnet 
wird : 



var X = E (X - EX) 2 . 

Die Varianz einer Zufallsvariablen ist demnach die im Mittel 
zu erwartende quadratische Abweichung dieser Zufallsvariablen 
von ihrem Erwartungswert; wird das zugrundeliegende Zufalls- 
experiment sehr oft durchgeführt, so ist der Durchschnitts-* 
wert aller auftretenden quadratischen Abweichungen der Zu- 
fallsvariablen X von EX ungefähr gleich var X . 



3.3.2 Die Varianz einer Zufallsvariablen X ist eine nicht- 
negative Zahl. Ist X eine stetige Zufallsvariable oder eine 
diskrete Zufallsvariable mit mehr als einer Ausprägung, gilt 

var X > 0. 

Nur dieser Fall ist für uns von Interesse. Die positive Wur- 
zel aus der Varianz heißt die Standardabweichung von X. 



3.3.3 Für eine diskrete Zufallsvariable X mit den Ausprä- 
gungen x^ , x 2 , ..., x^ und der Massefunktion f(x) gilt 
nach 3.1.3 (2) 



var X 



I 

I 

i=1 



(x ± - EX) 2 f(x ± ) . 
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Für eine stetige Zuf allsvariable X mit der Dichtefunktion 
f (x) hat man entsprechend 

var X = / (x - EX) 2 f(x)dx. 

Dabei ist lediglich vorausgesetzt, daß die Integrale 
/ |x|f(x)dx , / x 2 f(x)dx 

existieren . 

3.3.4 Beispiel: Ist X die beim Ausspielen eines echten 

Würfels auftretende Augenzahl, so gilt wegen EX = 3,5 
(vgl. 3.1.1 ) 

v 2 1 

var X = T (i - 3,5) • -/ 

i=i 6 

= -1 (2,5 2 + 1 , 5 2 + 0,5 2 + 0 , 5 2 + 1 , 5 2 + 2,5 2 ) 

= 4f = 2,916 . 

Die Standardabweichung von X ist somit 
/var X = v 2 ,916 = 1,708 . 

3.3.5 Bei der Berechnung der Varianz ist es oft zweckmäßig, 
die Formel 



var X = EX 2 - (EX) 2 



anzuwenden. Sie ergibt 
var X = 



sich , 


wie folgt 


E (X - 


EX) 2 


E [ X 2 


- 2XEX + (EX) 2 


EX 2 - 


2EXEX + (EX) 2 


EX 2 - 


(EX) 2 



71 




Die Varianz der beim Ausspielen eines echten Würfels auftre- 
tenden Augenzahl kann demnach wegen 



EX 



6 

I 

i=1 



i 2 



1 = 1(1 

6 6 U 



+ 4 + 9 + 16 + 25 + 36) = 



und EX = 3,5 sehr einfach berechnet werden 

var X = EX 2 - (EX) 2 = 21 - ( 1 ) 2 = || . 



3.3.6 Für die Varianz einer linearen Funktion aX + b 
Zufallsvariablen X gilt 

o 

var (aX + b) = a var X . 



Dies ergibt sich wegen E(aX + b) 



aEX + b wie folgt 



var (aX + b) 



= E[aX + b- E (aX + b)] 
= E [a (X - EX) ] 2 
= Ea 2 (X - EX) 2 

= a 2 E (X - EX) 2 
2 

= a var X . 



2 



Aus (1) folgt insbesondere, daß die Zufallsvariable 



X' = X ~ EX 

/var X 

den Erwartungswert 0 und die Varianz 1 besitzt. Mit 
den Abkürzungen 



2 

y = EX , a = var X 
gilt nämlich 



2i 

6 

der 

( 1 ) 
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EX' = E -1 (X - y) = -i (EX - y) =0 
1 1 

var X' = var - (X - u) = — =■ var X = 1 . 

O Z 

G 

X' wird als standardisierte Zufallsvariable oder als 
Standardisierung von X bezeichnet. 

3.3.7 Wir wollen eine Abschätzung für die Wahrscheinlichkeit 
angeben, mit der eine Zufallsvariable X Werte in einem 
Intervall [EX - c, EX + c ] mit c > 0 annimmt. Wir set- 
zen dabei var X > 0 voraus; andernfalls wäre 
W (EX -c<X<EX+c)=1 . Die uns interessierende Ab- 

schätzung lautet 

W (EX “ c < X < EX + c) > 1 - va ^- - X (2) 

c 

und wird Ungleichung von BIEN AYME-T SCHEBY SCHEFF genannt. 

Die Ungleichung von BIENAYME-TSCHEBYSCHEFF gilt für stetige 
und für diskrete Zufallsvariablen. Wir wollen hier nur den 
diskreten Fall betrachten und verweisen für den stetigen 
Fall auf FIS Z ( 1973, S. 98 ff.). 

Nehmen wir also an, X sei eine diskrete Zuf allsvariable 
mit den Ausprägungen x^ , x^, . ../ x^ und der Massefunktion 

f ( x ) . Das Intervall [EX - c, EX + c] bezeichnen wir mit A . 

(Vgl. Abb. 12.) 
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Es gilt für alle x . | A 



(x i - EX) 2 > c 2 

so daß folgt 

var X = l (x i - EX) 2 f(x i ) 

= I (X - EX) 2 f(x ) + l (X. - EX) 2 f (x . ) 

x^eA 1 1 x.^A 1 1 

> I c 2 f (x ) . 
x i iA 

Aus der damit bewiesenen Ungleichung ergibt sich 

Va ? x > I f(x. ) = 1 - W (EX - c < X < EX + c) 
c 2 x ± {h 1 = = 

und somit (2) . 

Wir setzen zur Abkürzung 
2 

y = EX , o = var X . 

Gibt man die Konstante c in Vielfachen von a an, defi- 
niert man also c = to , so läßt sich die Ungleichung (2) 
in der folgenden Form schreiben: 

W(y - tü < X < y + to) > 1 - -X? . (3) 

Für t < 1 ist die Abschätzung (3) trivial, da die rechte 
Seite dann negativ ist. Aber schon für t = 1 erhält man 
die nicht-triviale Aussage 

W ( y - o < X < y + a) > 0 . 

Im Intervall [y-cr, y + a] liegt also mindestens ein Wert, 
den X mit positiver Wahrscheinlichkeit annimmt. 
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Weitere Spezialfälle der Ungleichung (3) sind 



W ( y - 


1 ,5a 


< 


X 


< 


y 


+ 


1,5a) 


> 0,5 


W(u - 


2 a 


< 


X 


< 


y 


+ 


2 a ) 


> 0,75 


W(p - 


3 a 


< 


X 


< 


y 


+ 


3 a) 


V 

0 

00 1 



3.4 Kovarianz 

3.4.1 Nehmen wir an, X und Y seien Zufallsvariablen; 
a, b, c seien vorgegebene reelle Zahlen. Wir setzen 

Z = a + bX + cY 

und haben wegen der Linearität der Erwartungswertbildung 
EZ = a + bEX + cEY 



so daß folgt 

Z - EZ = b ( X - EX) + c (Y - EY) . 

Aus der letzten Gleichung erhält man 

(Z - EZ) 2 = b 2 (X - EX) 2 

+ 2bc (X - EX) (Y - EY) + c 2 (Y - EY ) 2 

und hieraus wegen der Linearität der Erwartungswertbildung 

var Z = b 2 var X + 2bcE (X - EX) (Y - EY) + c 2 var Y . 
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Man bezeichnet nun 



cov (X,Y) = E(X - EX) (Y - EY) 

als Kovarianz von X und Y und hat dann 

var ( a + bX + cY) = b^ var X + 2bc cov(X,Y) + var Y, (1) 

Allgemeiner ist für Zufallsvariablen X^ , X 2 , . .., X^ und 
für reelle Zahlen a Q , a^ , . .., a n erfüllt 

var(a + a.X- + a 0 X 0 + ... + a X ) 
o 1 i 2. 2 n n 

a^varX 1 +2a 1 a 2 cov (X 1 , X 2 ) + 2a 1 a 3 cov {X^ ,X 3 ) +. . . +2a^ a n cov (X^ ,X^) 

+ a^varX 2 +2a 2 a 3 cov(X 2 ,X 3 ) +. . ,+2a 2 a n cov(X 2 ,X^) 

2 (2) 
+ a 3 varX 3 + . . . +2a 3 a n cov (X 3 , X R ) 

2 

+ a varX 
n n 

3.4.2 Bevor wir zur Interpretation von cov (X,Y) kommen, 
wollen wir einfache Umformungen behandeln. 

2 2 

Als Verallgemeinerung der Beziehung var X = EX - (EX) 
hat man 

cov (X , Y ) = EXY - EX-EY . 

Es gilt nämlich 

(X - EX) (Y - EY) = XY - XEY - (EX)Y + EXEY 

und wegen der Linearität der Erwartungswertbildung folgt 

cov (X , Y) = E ( X - EX) (Y - EY) 

= EXY - EXEY - EXEY + EXEY 
= EXY - EXEY . 
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3.4.3 Das Vorzeichen der Kovarianz zweier Zuf allsvariablen 
X und Y vermittelt eine grobe Vorstellung vom Zusammen- 
hang der beiden Zufallsvariablen: Die Kovarianz ist positiv, 
wenn die Zufallsvariablen X - EX und Y - EY vorwiegend 
Werte mit gleichem Vorzeichen annehmen. Im Falle cov (X,Y) > 0 
treffen also vorwiegend große Werte von X mit großen Werten 
von Y zusammen. Im Falle cov (X,Y) < 0 treffen dagegen 
große Werte der einen Zuf alls variablen vorwiegend mit klei- 
nen Werten der anderen zusammen. 

Als Maß für die Stärke des Zusammenhangs der Zuf allsvariablen 
X und Y verwendet man üblicherweise jedoch nicht cov (X,Y), 
sondern den sog. Korrelationskoeffizienten 

p(x , Y ) = een, (X,Y) _ _ 

/var X var Y 

Von ihm läßt sich dasselbe sagen, was oben von cov (X,Y) ge- 
sagt ist. Im übrigen hat p(X,Y) als Maß für die Stärke des 
Zusammenhangs von X und Y zwei Vorteile gegenüber cov (X,Y); 

a) Der Korrelationskoeffizient ist nicht von den Ein- 
heiten abhängig, in denen die Zufallsvariablen gemes- 
sen sind. 

b) Der Korrelationskoeffizient ist normiert. 

3.4.4 Um a) einzusehen, gehe man beispielsweise davon aus, 
die Maßeinheiten von X und Y seien Meter bzw. Kilogramm. 

Bei Verwendung der Maßeinheiten Zentimeter bzw. Gramm würde 
man statt X und Y die Zufallsvariablen 

X' = 100 X 
Y' = 1000 Y 

beobachten. Nun gilt 
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100 EX 



EX' 
EY' 
var X' 
var Y' 
cov (X ' , Y ' ) 



= 1000 EY 
= 100 2 var X 
= 1000 2 var Y 

= E ( 1 00 X - 100 EX ) ( 1 000 Y - 1000 EY ) 
= 100*1000 cov (X , Y ) 



und es folgt 

P (X' ,Y' ) 



cov (X 1 , Y 1 ) 
/var X ' . var Y ,l 



1 00 * 1 000 » cov (X,Y) 
y\ 00 2 • var X-1000 2 . var Y 



cov (X , Y ) 
/var X«var Y 1 



P (X, Y) . 



Man gelangt also zum selben Korrelationskoeffizienten, 
gleichgültig für welche Maßeinheiten man sich entscheidet. 

3.4.5 Mit b) ist gemeint, daß die Doppelungleichung 

-1 < p (X , Y ) < +1 

die wir auch in der Gestalt 

[p (X,Y)] 2 < 1 (3) 

schreiben können, stets erfüllt ist. Um (3) zu beweisen, 
setzen wir in (1) speziell a = 0, b = 1 und 

c = __ cov (X , Y) 
var Y 



und erhalten 



var (X - cov (X>Y) Y) = var X - l c - ° - v - - ( - x > Y )^ 
var Y var Y 
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Da die Varianz einer Zufallsvariablen nichtnegativ ist, ist 
die linke Seite der letzten Gleichung nichtnegativ und wir 
erhalten 



var X 



[cov ( X , Y ) ] > Q 

var Y ” 



woraus sich (3) ergibt. 

3.4.6 Zufallsvariablen mit positivem Korrelationskoeffizien- 
ten nennt man positiv korreliert ; man nennt sie negativ 
korreliert wenn ihr Korrelationskoeffizient negativ ist, 
und man nennt sie unkorreliert wenn ihr Korrelationskoeffi- 
zient gleich 0 ist. 

Für unabhängige Zufallsvariablen X und Y gilt nach 3. 1.7 (4) 



EXY = EXEY . 

Also ist cov (X , Y ) = 0 und somit 
P ( X , Y) = 0 

erfüllt. Unabhängige Zufallsvariablen sind also stets un- 
korreliert. Für unkorrelierte Zufallsvariablen X und Y gilt 
nach 3.4.1 (1) bei beliebigen a, b und c 

var (a + bX + cY) = b^ var X + c^ var Y. 

3.4.7 Zufallsvariablen X^ , X 2 , ..., X n nennt man paarweise 

unkorreliert , wenn je zwei der Zufallsvariablen unkorreliert 
sind. Nach 3.4.1 (2) hat man für paarweise unkorrelierte Zu- 
fallsvariablen X ^ , X 2 , . . . , X^ und reelle Zahlen a Q , a<j , . . . , a n 



var (a Q + a^X^ + 



+ a nV 



2 2 

= a- var X- + ... + a var X . 
11 n n 



(4) 
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Nach 2.2.4 sind unabhängige Zufallsvariablen , X 2 , . . . , X n 
paarweise unabhängig , d. h. je zwei der Zufallsvariablen 
X^ , X 2 , . . . , X n sind unabhängig, weshalb sie nach 3.4.6 auch 
paarweise unkorreliert sind. Folglich gilt Gleichung (4) ins- 
besondere für unabhängige Zufallsvariablen. 

3.4.8 X und Y seien Zufallsvariablen, a und b be- 
liebige reelle Zahlen, p und q nichtnegative ganze Zah- 
len. Dann bezeichnet man 

E(X - a) P (Y - b) q (5) 

als Moment der Ordnung p + q bezüglich a und b und 

E (X - EX) P (Y - EY) q (6) 

als zentrales Moment der Ordnung p + q . 

Wenn in (5) gesetzt wird 

p= 1, q = 0 , a=o 

erhalten wir EX . Demnach ist der Erwartungswert einer 
Zufallsvariablen ein Moment 1. Ordnung. Setzt man in (6) 

p = 2, q = 0 
o 

so ergibt sich E(X - EX) ; wenn man in (6) 
p = q = 1 

setzt, erhält man E(X - EX) (Y - EY) . Die Varianz einer 
Zufallsvariablen und die Kovarianz zweier Zufallsvariablen 
sind also zentrale Momente 2. Ordnung. 
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3.5 Momente des Stichprobenmittels und der 
Stichprobenvarianz 

3.5.1 Wenn X^ , X 2 , . .., unabhängige Zuf allsvariablen 

sind, die dieselbe Verteilungsfunktion F(x) besitzen, 
sagt man kurz, (X 1 , X 2 , ..., X^) sei eine Stichprobe aus 

der Verteilung F(x) ; n wird als Stichprobenumfang be- 
zeichnet . 



Wenn X^ , X 2 , . . . , X^ beispielsweise die Augenzahlen sind, 

die sich beim n-maligen Ausspielen eines echten Würfels ein- 
stellen, ist ( X^ , X 2 , ..., X^) eine Stichprobe aus der 

Verteilung 



F (x) 




für 

für 

für 

für 

für 

für 

für 



x < 1 

1 < x < 2 

2 < x < 3 

3 < x < 4 

4 < x < 5 

5 < x < 6 

6 < x . 



Nehmen wir allgemeiner an, man interessiere sich für ein 
bestimmtes Zufallsexperiment und eine auf der Ergebnismenge 
dieses Zufallsexperiments definierte Zufallsvariable X mit 
der Verteilungsfunktion F(x) . Das Zufallsexperiment werde 
n-mal unabhängig durchgeführt. Dann sind die Zufallsvariab- 
len X^ , X 2 , ..., X^ , die angeben, welche Werte X bei der 
ersten, zweiten, ... bzw. n-ten Durchführung annimmt, offen- 
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bar unabhängig und ( X ^ , . .., X n ) ist eine Stichprobe 
aus der Verteilung F(x). 

3.5.2 Wenn (X^ , X 2 , . .., X ) eine Stichprobe (aus einer 
Verteilung F(x) ) ist, nennt man jede Funktion der Zufalls- 
variablen X^ , X^, . .., Stichproben funktion ; insbesondere 

heißt 



n 

I 

i=1 



X. 

1 



Stichprobenmittel und 



S 



2 



1 

n-1 



I 



i=1 



(X i - x ) 2 



Stichprobenvarianz . Im folgenden wollen wir uns mit der Be- 

_ 2 

rechnung der Erv/artungswerte von X und S und mit der 
Berechnung der Varianz von X beschäftigen. 



3.5.3 Wenn ( X ^ , X 2 , ..., X^) eine Stichprobe ist, gilt 

. . . = EX 

n 

... = var X , 
n 

2 

Wir schreiben nun y für den Erwartungswert und o für 

die Varianz der Zufallsvariablen X 1 , X 0 , ..., X . Wegen 

\ i n 1 ) 

der Linearität der Erwartungswertbildung gilt dann 

EX = - 7 EX. = - n y = y 
n L l n 

und wegen der Unabhängigkeit der Zufallsvariablen 
X^ , X 2 , ..., X^ nach 3.4.7 (4) 

2 

var X = \ var X. = — n a 2 = — „ (1) 

n n 



EX 1 = EX 2 = 
var X^ = var X 2 = 



Im folgenden werden wir häufig auf die Angabe der Summa- 
tionsgrenzen verzichten, wenn sich diese ohnehin aus dem 
Zusammenhang ergeben. 
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3.5.4 Man hat 



1 

n- 1 


l (X i -X) 2 = 


1 

n-1 


l ([x i -p] - 


CM 

1 

IX 


1 

n-1 


I ([x^y ] 2 


- 2 [ X 


i -p][X-p] + 


tx-p ] 2 ) 


1 

n- 1 


l (x r p ) 2 - 


2n 
n- 1 


x 2 , n 

< x -y) + — 


(X-p) 2 


1 

n-1 


l (x.-p ) 2 - 


n 

n-1 


(X-p) 2 





und es folgt 



iv^T 5 


■ E(X i 


-p) 2 


- e <^ )2 


n^T ^ 


» var 


X. - 

l 


n ü 

r var X 

n-1 


1 

t n 

n- 1 


2 

o - 


n 


2 

G 


n-1 


n 



2 

= G , 



Das Stichprobenniittel besitzt also den Erwartungswert y , 

2 

die Stichprobenvarianz den Erwartungswert a 

3.5.5 Die Varianz des Stichprobenmittels wird nach Glei- 
chung (1) bei wachsendem Stichprobenumfang n beliebig 
klein. Daraus läßt sich eine wichtige Folgerung ableiten: 
Nach der Ungleichung von BIENAYME-TSCHEBYSCHEFF gilt für 
beliebiges c > 0 

W (EX - c < X < EX + c) > 

(vgl. 3.3.7 (2) ) und daher 

W (y-c<X<y + c) > 1 

Aus der letzten Ungleichung erhält man durch Grenzübergang 
n -*• °° das sogenannte (schwache) Gesetz der großen Zahlen 

lim W(y-c<X<y + c)=1. (2) 

n-M» ~~ “ 



1 - 



var X 



t 2 

~2 
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Das heißt: Wie klein man das Intervall [y-c,y+c] auch 
wählt - die Wahrscheinlichkeit, mit der X einen Wert 
dieses Intervalls annimmt, konvergiert bei wachsendem n 
gegen 1 . 

Wenn die Wahrscheinlichkeit eines Ereignisses sehr nahe bei 
1 liegt, sagt man üblicherweise, es sei "praktisch sicher", 
daß dieses Ereignis eintritt. Bei Verwendung dieser Rede- 
weise können wir die angegebene Beziehung so formulieren: 

Wie klein ein Intervall um y auch gewählt wird, es ist 
praktisch sicher, daß das Stichprobenmittel X in dieses 
Intervall fällt, sofern n hinreichend groß ist. 



3.6 Stochastische Konvergenz 

3.6.1 X^ , X^ f ..., X n seien Zufallsvariablen. 

Wenn die Zufallsvariable Z eine Funktion der Zufallsva- 
riablen X^ , X 2 , ..., X n ist und bei beliebigem c > 0 
gilt 



lim W(a-c<Z<a + c) =1 
n+°° 



sagt man, Z konvergiere stochastisch gegen a . 

Eine stochastisch konvergente Zufallsvariable haben wir in 
Abschnitt 3.5.5 kennengelernt. Ist ( X ^ , X 2 , ..., X^) 

nämlich eine Stichprobe mit EX^ = y (i = 1 , 2 , . . . , n) , 

so konvergiert Z = X nach 3.5.5 (2) stochastisch gegen y . 



3.6.2 Wir nehmen an, U und V seien stochastisch konver- 
gent gegen a bzw. ß . Dann konvergiert 
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U stochastisch gegen a 

U + V stochastisch gegen a + ß 

U - V stochastisch gegen a - ß 

UV stochastisch gegen aß 

und wenn ß ^ 0 gilt 

U a 

Y stochastisch gegen — . 

Diese Aussagen folgen aus einem allgemeineren Satz von 
SLUTSKI; vergl. dazu FISZ (1973), S. 282 ff. 

3.6.3 (X^ , X 2 , ..., X n ) sei eine Stichprobe mit 



EX i = y 



var X . = a 
i 



für i=1, 2, ...,n. Wir wollen zeigen, daß 

s ' = E (x i " R)2 

2 2 
stochastisch gegen o konvergiert. Wir schreiben dazu S 

in der Gestalt 

S 2 = — L- z x 2 £_ X 2 . 

n-1 i n-1 

2 2 2 

Weil (X^ , X 2 , .../ X n ) eine Stichprobe ist, konvergiert 



i 7 X 2 und damit auch — Ur J X 2 

n L i n-1 L i 



stochastisch gegen EX . X konvergiert stochastisch gegen 

-2 2 
Nach 3.6.2 konvergiert X also stochastisch gegen y 

2 

und S gegen 



T-, v 2 2 2 

EX - y = o 



wie behauptet. 




3.6.4 X und Y seien Zufallsvariablen, Wenn p und q 
nichtnegative Zahlen sind, bezeichnet man 



E (X - EX) P (Y - EY) q (1 ) 

als (zentrales) Moment der Ordnung p + q (vgl. 3.4.8). 

Nun seien (X^ , X 2 , ..., X n ) und (Y^ , Y 2 , ..., Y r ) Stich- 
proben; außerdem sei (X^, Y^ ) ebenso verteilt wie (X,Y) 
für i = 1, 2, ..., n . Dann sagt man (X^ , X 2 , . .., X n ) 
und (Y^ , Y 2 / . .., Y r ) seien verbundene Stichproben' aus 

der Verteilung von X und Y und bezeichnet 



1 

n-1 



n 

I 

i=1 



(X, 



X) P (Y i - Y) q 



( 2 ) 



als (zentrales) Stichprobenmoment ; man sagt, dieses Stich- 
probenmoment entspreche dem Moment (1) . Die in 3.5.2 

2 

definierte Stichprobenvarianz S ist ein spezielles Stich- 
probenmoment, da man in (2) nur p = 2 und q = 0 set- * 

2 

zen muß, um S zu erhalten. 



Den verbundenen Stichproben stehen die sog. unabhängigen 
Stichproben gegenüber. 

Man nennt Stichproben (X^ , X 2 , ..., X m ) und (Y^ , Y 2 , .. . , Y ß ) 
unabhängig , wenn X^ und Y ^ unabhängig sind, gleichgültig 
wie i = 1 , 2, ..., m und j = 1 , 2, ..., n gewählt wer- 
den. Entsprechend ist die Unabhängigkeit von mehr als zwei 
Stichproben definiert. 

Verbundene Stichproben beziehen sich stets auf ein Zufalls- 
experiment, während unabhängige Stichproben für unabhängige 
Teilexperimente definiert sind. Nehmen wir beispielsweise 
an, man führe ein bestimmtes Verfahren zur Produktion von 
Glühlampen m-mal durch und bezeichne mit X^ die Brenn- 
dauer der i-ten Glühlampe. Nach einem anderen Verfahren 
stelle man n Glühlampen her, deren Brenndauer mit 
Y ^ , Y 2 , . . . , Y n und deren Gewichte mit Z^, Z 2 , ..., Z^ 

bezeichnet seien. Dann sind (X., X^, . .., X ) und 

12 m 

(Yi , Y 2 , ..., Y n ) unabhängige Stichproben, während 
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(Y i , Y 2 , Y n ) und (Z^, Z 2 , . .., Z ) verbundene 

Stichproben sind. 



In 3.6.5 lernen wir eine Aussage für verbundene Stichproben 
kennen. Danach werden uns die Begriffe "verbundene Stich- 
proben" und "unabhängige Stichproben" erst wieder in den 
Teilen SCHÄTZEN und TESTEN beschäftigen. 



3.6.5 Man kann zeigen, daß das Stichprobenmoment (2) 
stochastisch gegen das entsprechende Moment (1) konver- 
giert. In 3.6.3 haben wir einen Spezialfall dieser Aus- 
sage kennengelernt. Hier soll ein weiterer Spezialfall be- 
wiesen werden, und zwar soll p = q = 1 gesetzt werden. 
Dann hat man offenbar 



H=T l 'V*) (Y i- ?) = 5PT l X i Y i - ?FT XY - 

Nun ist ( X ^ Y ^ , X 2 Y 2 , . .., X^Y^) eine Stichprobe. Demnach 

konvergiert 



- y X . Y . 
n L ii 



stochastisch gegen EXY . Weil X und Y stochastisch 
gegen EX bzw. EY konvergieren, konvergiert XY gegen 
EXEY und 



1 

n- 1 



X. Y. 

l l 



XY 



gegen 



EXY - EXEY = E(X - EX) (Y - EY ) . 
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3.7 Aufgaben 



3.7.1 Berechnen Sie den Erwartungswert, die Varianz und 
die Standardabweichung der in Aufgabe 2.5.1 definierten 
Zufallsvariablen X . 



Lösung : 

Für die Berechnung des Erwartungswerts und der Varianz von 
X legen wir eine Hilfstabelle an 



X . 
1 


f (x ± ) -36 


x. f (x. ) • 36 

l l 


2 

X. 

i 


x ± 2 f (x ± ) * 36 


2 


1 


2 


4 


4 


3 


2 


6 


9 


18 


4 


3 


12 


16 


48 


5 


4 


20 


25 


100 


6 


5 


30 


36 


180 


7 


6 


42 


49 


294 


8 


5 


40 


64 


320 


9 


4 


36 


81 


324 


10 


3 


30 


100 


300 


1 1 


2 


22 


121 


242 


12 


1 


12 


144 


144 


I 


- 


252 


- 


1974 



Es ergibt sich 



EX = l x 1 f(x i ) = m- = 7 



EX 



y x * f(x )= 1211 = 329 

l x ± Z(X ± ) 36 6 



2 2 329 

var X = EX - (EX) = - 49 

6 



5,83 
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Die Standardabweichung von X beträgt somit 



/var X ' = /5,83 ' = 2,42, 



3.7.2 Berechnen Sie den Erwartungswert, die Varianz und 
die Standardabweichung der in Aufgabe 2.5.2 definierten 
Zuf allsvariablen X . 



Lösung : 

Aus der Tabelle 



X . 

i ! 


f (x ± ) -37 


X i f (Xj_ ) * 37 


1 * 

1 K> 

1 


x i 2 f ( Xi ) -37 


38 i 


1 


i 

38 


1444 


1444 


4 


8 


32 


16 


128 


2 


19 


38 


4 


76 


0 


9 


0 


0 


0 


I 


- 


108 


- 


1648 



erhalten wir 



EX = 



EX 2 = 



var X = 



108 

37 

1648 

37 

1648 



= 2,919 



- ( A2JL ) 2 = 36,020 



37 v 37 

Die Standardabweichung von X ist also 



/var X = /36 ,020 ‘ = 6,002 . 
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3.7.3 a) 



und X 9 seien unabhängige Zufallsvariablen 

^ 2 
mit EX^ = EX 2 = y und var X^ = var X 2 = o 

Berechnen Sie den Erwartungswert und die Varianz 

der Summe X^ + X 2 und der Differenz X^ - X 2 . 

b) X^ und X 2 seien die Augenzahlen beim zweimali- 
gen Ausspielen eines echten Würfels. Wir setzen 

X = X 1 + X 2 f Y = X 1 - X 2 

Zeigen Sie, daß X und Y unkorreliert , aber 
nicht unabhängig sind. 

Lösung : 



a) Wegen der Linearität der Erwartungswertbildung hat man 

E(X 1 + X 2 ) = EX 1 + EX 2 = y + y = 2y, 

Da X ^ und X 2 unabhängig sind, gilt 

var (X^ + X 2 ) = var X^ + var X 2 = a 2 + a 2 = 2a 2 . 

Für die Differenz X^ - X 2 erhält man entsprechend 

E(X 1 - X 2 ) = EX 1 - EX 2 = y - y = 0 

2 2 2 

var(X^ - X 2 ) = var X^ + var X 2 = a + a = 2a . 

Die Summe X^ + X 2 und die Differenz X^ - X 2 der (unabhän- 
gigen) Zufallsvariablen X^ und X 2 haben also die gleiche 
Varianz . 

b) Wir berechnen die Kovarianz von X und Y . Es gilt 



XY 



(x 1 + x 2 ) (x 1 - x 2 ) 



X 1 + X 1 X 2 

X 2 - X 2 

X I X 2 



X 1 X 2 - X 2 
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hat man 



Wegen var X 1 = var X 2 

EX ! 2 = EX 2 2 

und folglich 

EXY = E (X 1 2 - X 2 2 ) = EX 1 2 - EX 2 2 = 0 . 

Ferner gilt nach a) 

EY = E (X 1 - X 2 ) =0 . 

Wir erhalten also 

cov ( X , Y ) = EXY - EXEY =0-0=0 

d. h. die Zufalls variablen X und Y sind unkorreliert . 

X und Y sind unabhängig, wenn für alle Ausprägungen x 
und y von X bzw. Y 

W(X = x, Y = y) = W(X = x) W(Y = y) 

erfüllt ist. Wir betrachten den Fall x = 7 und y = 0 . 
Es ist 

{x = 7} = {(1,6), (2,5) , . . . , (6,1) } 

{ Y = 0} = {(1,1), (2,2) , . . . , (6,6) } 

also 

W(X = 7) = W(Y = 0) = Jg = | • 

Wegen 

{X = 7}a{y = 0} = 0 
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haben wir 



W(X = 7 , Y = O) = O 



und somit 

W(X = 7, Y = O) ± W(X = 7) W(Y = O) . 

Damit ist bereits gezeigt, daß X und Y nicht unabhängig 
sind. 

3,7.4 Eine stetige Zufallsvariable X besitze die Dichte- 
funktion 



f 2x für O < x < 1 
f(x) = \ 

V 0 sonst . 

Berechnen Sie den Erwartungswert und die Varianz von X . 

Lösung : 



EX 



EX 



2 



var X 



/ xf(x)dx = / 2x dx - 

-CO O 

1 2 ^3 

f X f(x)dx = f 2x dx = 

O O 

2 

EX 2 - (EX) 2 = \ - (§) 




2 

3 

1 

2 



1 

= T5 * 
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4. Spezielle diskrete Verteilungen 



4.1 BERNOULLI-Verteilung 



4.1.1 X sei eine diskrete 



gungen 


0 und 1 


. Wenn 


sitzt , 


ist 





X 


f (x) 


0 


1-W(X=1 ) 


1 


W(X=1 ) 



Zufallsvariable mit 
die Massefunktion 



den Ausprä- 
f (x) be- 



die Wahrscheinlichkeitstabelle von X . Die Verteilung von X 
ist demnach durch die Angabe von 

6 = W(X = 1 ) 

bereits festgelegt. 

Eine Zufallsvariable X mit der Wahrscheinlichkeitstabelle 



X 


f (x) 


0 


i-e 


1 


e 



nennt man BERNOULLI-verteilt mit dem Parameter 6 . 
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4.1.2 Wir nehmen an, es seien ein Zufallsexperiment mit der 
Ergebnismenge fl und ein beliebiges Ereignis A Cfl gege- 
ben. Wir betrachten die Zufallsvariable , die wie folgt 

definiert wird 



( 1 falls e e A 

X A (S) = 1 

V 0 falls e e A . 

gibt also an, wie oft A bei der (einmaligen) Durch- 
führung des fraglichen Zufallsexperiments eintritt. Man 
nennt X^ Indikatorvariable von A . X^ ist offensicht- 
lich BERNOULLI -verteilt mit dem Parameter W(A) . 

4.1.3 Wenn X BERNOULLI-verteilt ist mit den Parameter 6 , 
hat man offensichtlich 

EX = 6 (1) 

var X = EX 2 - (EX) 2 

= e - e 2 

= e ( i - e) . (2) 

4.1.4 Die Zufallsvariablen X^ , X 2 , ..., X n seien unab- 
hängig und BERNOULLI-verteilt mit dem Parameter 0 . Nach 
unseren Definitionen ist (X^ , X 2 , . .., X n ) dann eine 
Stichprobe mit (vgl. 4.1.3) 

EX ± = 0 

var X i = 0 (1 - 6) 

und für das Stichprobenmittel gilt nach 3.5.3 



ex = e 


(3) 


var X = 9(1 - 6) . 

n 


(4) 



Weil 



X. + X~ + ... + X 
12 n 
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angibt, wie viele der Variablen X^ , X^, . . . , X n den Wert 1 
annehmen, ist das Stichprobenmittel 



X 



X-+X 9 +. . • +X 
1 z n 

n 



als Anteil der Variablen zu interpretieren, die den Wert 1 
annehmen. Wegen dieser Besonderheit schreibt man unter den 
gegebenen Voraussetzungen meist P statt X . P heißt 
Stiohprobenanteil . Wegen (3) und (4) hat man 



ep = e 



var P 



6 ( 1 - 6 ) 



n 



(5) 

( 6 ) 



4.1.5 Wir wenden die Ungleichung von BIENAYME-TSCHEBYSCHEFF 
auf die Zufallsvariable P an und erhalten wegen (5) und 
(6) für jede Zahl c > 0 

w(e - c<p<e + c)>i - ~ W ' J 

nc 

Die Funktion 0(1 - 0) hat für 0 < 6 < 1 folgenden Verlauf. 
0 ( 1 - 0 ) 




An der Stelle 0 = 0,5 liegt also ein Maximum, d. h. es gilt 
0(1 - 6) < 1/4. 
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Somit hat man 



1 



6 ( 1 - 6 ) > 
2 

nc 



1 



4nc 



2 



und folglich 

W ( 6 - c<P<6 + c) >1 . (7) 

4nc 

Nach dem in 3.5.5 bewiesenen "Gesetz der großen Zahlen" kon- 
vergiert der Stichprobenanteil P stochastisch gegen die Wahr- 
scheinlichkeit 6. Die Ungleichung (7) besagt aber mehr, denn 
sie liefert für festes n und c eine untere Schranke für 
W(|P - 6 | < c) . So folgt z. B. für c = 0,01: Die Wahrschein- 
lichkeit, mit der sich P von 0 um höchstens ein Hundertstel 
unterscheidet, ist beim Stichprobenumfang 2500 größer als 0,9 
beim Stichprobenumfang 25 000 größer als 0,99 usw. 



4.2 Binomialverteilung 

4.2.1 X ^ , X 2 , ..., X^ seien BERNOULLI-verteilte Zufalls- 

variablen mit 



EX ± =6 (i = 1 , 2, . . . , n) . 

Die Zufallsvariable 

X = Xl + X 2 + . . . + x n 

gibt dann an, wie viele der Variablen X^ , X 2 , ..., X^ den 
Wert 1 liefern. Nach 1.6.6 (6) gilt für m = 0, 1, ..., n 

w ( x = m) = (*) e m (1 - e ) n-m . 
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Die Massefunktion von X hängt also von den beiden Parame- 
tern n und 6 ab und lautet 



l' (^) 6 X (1 “ 6) n X für x = 0, 1, n 

f ( x | n ; 0 ) = -j 

i 

V 0 sonst. 

Eine Zufallsvariable mit der Massefunktion f(xjn;0) heißt 
binomialvevteilt mit den Parametern n und 6 . 

In der folgenden Abb . 14 sind für einige Werte der Parameter 
n und 0 die Massefunktionen f(x|n;0) dargestellt. 



f(x|8; 

0 , 3 ' 

0,2 

0,1 h 

0 

-1 

f(x |8, 
0,3 

0,2 
0,1 
0 

-1 



0 , 2 ) 



0 1 
0 , 5 ) 



0 1 



f ( x 1 8; 0,8) 




Die für Abb. 14 verv/endeten Daten sind in der folgenden Ta- 
belle angegeben. 



X 


f ( x | 8 ? 0,2) 


f (x | 8 ; 0,5) 


00 

O 

00 

M-l 


0 


0,1678 


0,0039 


0,0000 


1 


0,3355 


0,0312 


0,0001 


2 


0,2936 


0,1094 


0,001 1 


3 


0,1468 


0,2188 


0,0092 


4 


0,0459 


0,2734 


0,0459 


5 


0,0092 


0,2188 


0,1468 


6 


0,001 1 


0,1094 


0,2936 


7 


0,0001 


0,0312 


0,3355 


8 


0,0000 


0,0039 


0,1678 



4.2.2 Wenn X binomialverteilt ist mit den Parametern n 
und 0 , gilt 

n 

EX = l xf (x | n ; 0 ) 
x=0 



Wegen 



n 

= l 

x=0 



(£> 0X n 



Q ) 1 



n 

= I 

X=1 



<x> 



e x (i - 



f n ') = x , n! , 

Vx' x x! (n-x) i 



n (n-1 ) ! 
x (x- 1 ) ! (n-x) ! 






folgt 

ex = n l ("“]) e x (i - e ) n-x 

X=1 

= ne l ( n "h e x_1 (i - e j (n-i)-(x-i) ^ 
x=1 x 1 

Wenn wir y = x - 1 als Summationsindex einführen, ergibt 
sich 
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n-1 



ex = ne l t 11 ” 1 ) e y (1 - e) 

y=0 y 



(n-1 ) -y 



Nun gilt 



n ~l -e) (n-1) - y = V f ( y | n— 1 



= 1 



y=0 



y=0 



und man erhält 

EX = ne (1 ) 

Weiter hat man 

n ~ 

var X = £ (x - n6) f(x|n;6) 

x=0 

= l (X - ne ) 2 (£) e x (1 - e) n_x . 

Durch einige algebraische Umformungen des Ausdrucks auf der 
rechten Seite der letzten Gleichung erhält man 

var X=n6(1-e) (2) 

4.2.3 Einfacher als die angegebene Herleitung von (1) und 
die skizzierte Herleitung von (2) ist die folgende Überle- 
gung : 

Die Zufallsvariable X ist binomialverteilt mit den Parame- 
tern n und 6 . Sie besitzt daher dieselbe Verteilung wie 
eine Summe von n unabhängigen BERNOULLI-verteilten Zu- 
fallsvariablen X ^ , X 2 , .../ X^ , die den Erwartungswert 0 

und die Varianz 6(1 - 9) besitzen (vgl. 4.2.1 ). Wegen der 

Linearität der Erwartungswertbildung hat man also 

EX = EX, + EX n + . . . + EX = n9 
1 2 n 



99 




und nach 3.4.7 (4) 



var X = var X. + var X~ + ... + var X 
i 2 n 

= ne (1 - 0 ). 

4.2.4 Beispiel: Eine Urne sei gefüllt mit N Kugeln, von 
denen M rot und N-M weiß sind. Wir ziehen n Kugeln 
mit Zurücklegen, bezeichnen die Anzahl der dabei auf treten- 
den roten Kugeln mit X und wollen die Masse funktion von 
X ermitteln. 

Wir betrachten zunächst das Ziehen einer Kugel und setzen 

f 1 falls die gezogene Kugel rot ist 

X o = \ n 

V 0 sonst . 

X besitzt die Wahrscheinlichkeitstabelle 



X 


f (x) 


0 


1 - £ 
N 


1 


M 


N 



Nun kommen wir wiederum zum n-maligen Ziehen mit Zurück- 
legen und definieren für i = 1, 2, ..., n 

f 1 falls die i-te gezogene Kugel rot ist 

Xi = 

V 0 sonst . 

Die Zufallsvariablen X^ , , ..., X^ sind unabhängig und 

BERNOULLI-verteilt mit dem Parameter M/N , und es gilt 

X = X, + X n + . . . + X . 
i 2 n 
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Also ist X binomialverteilt mit den Parametern n und 
M/N . Die Masse funk tion von X lautet 



f (x|n;|) 



und es gilt 



M 

n N 




(3) 


M 

n N (1 


- ü) . 

tr 


(4) 



4.3* Hypergeometrische Verteilung 

4.3.1 Eine Urne enthalte N Kugeln, von denen M rot 
seien. Wenn n Kugeln ohne Zurücklegen gezogen werden, ist 
die Anzahl X der roten Kugeln, die in die Auswahl gelangen, 
eine Zufallsvariable. Für m = 0, 1, 2, . .., n gilt 




Um dies zu beweisen, nehmen wir an, die roten Kugeln seien 
von 1 bis M numeriert, die übrigen von M + 1 bis N . 
Einige der n-Tupel , die sich beim n-maligen Ziehen ohne 
Zurücklegen einstellen können, haben die Eigenschaft 

Die ersten m Zahlen sind höchstens gleich M, ^ 
und die übrigen sind größer als M . 

Dabei ist m = 0, 1, ..., n beliebig vorgegeben. Es gibt 
nun (vgl . A 1.2.8) 

M! 

(M-m) ! 
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m-Tupel , die aus den Zahlen 1, 2, . .., M ohne Wiederholung 
gebildet sind, und es gibt 



(N-M) ! 

(N-M- (n-m) ) ! 



(n-m)-Tupel , die aus den Zahlen M + 1, M + 2, ...,N 
ohne Wiederholung gebildet sind. Also gibt es 

Ml (N-M) I 

(M-m) ! ‘ (N-M-n+m) ! 

n-Tupel mit der Eigenschaft (2) . Nun zeichnen wir nicht 

unbedingt die ersten m , sondern m beliebige Positionen 
eines n-Tupels aus, etwa die Positionen 1, 2, ..., m-1 
und m + 1 . Die Zahl der n-Tupel , die ohne Wiederholungen 
gebildet sind und die Eigenschaft 

Die an den ausgezeichneten Positionen stehenden 
Zahlen sind höchstens gleich M , und die übrigen 
sind größer als M 

besitzen, ist gleich (3) . Da man 



Möglichkeiten hat, m von n Positionen auszuzeichnen, 
gibt es 

,n, _ MI (N-M) I 

V * (M-m) I * (N-M-n+m) I 

verschiedene n-Tupel , in denen m der Zahlen 1, 2, ..., M 
und n-m der Zahlen M+ 1, M+ 2, ..., N Vorkommen. 

Von den insgesamt 

NI 

(N-n) I 
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möglichen n-Tupeln besitzen also 



( n \ Ml (N-M) 1 

m * (M-m) ! * (N-M-n+m) 1 



die Eigenschaft 

Es gibt genau m Positionen, die mit Zahlen, die 
roten Kugeln entsprechen, besetzt sind. 



Die Wahrscheinlichkeit dafür, daß bei n-maligem Ziehen 
genau m rote Kugeln in die Auswahl gelangen, ist somit, 
wie behauptet, 



f n. M! (N-M) ! 

V' (M-m) 1 * (N-M-n+m) 1 



N! 

(N-n) ! 



/M \/N-M s 




4.3.2 Nach (1) ist die Wahrscheinlichkeit dafür, bei 
4-maligem Ziehen aus einem Skatblatt genau drei Kreuz- 
karten zu bekommen, gleich 




168 

4495 



0,0374 . 



Die Wahrscheinlichkeit, alle vier Buben zu erhalten, ist 



J V 0 J _ 1 

( 3 /) ' (?) 



1 

35 960 



= 0,000 0278. 



4.3.3 Mit X bezeichnen wir weiterhin die Anzahl der roten 
Kugeln, die in die Auswahl gelangen, wenn man n-mal ohne 
Zurücklegen aus einer Urne zieht, die mit M roten und 
N-M andersfarbigen Kugeln gefüllt ist. Nach (1) ist 
die Massefunktion von X durch die drei Parameter n, N 
und M bestimmt; wir bezeichnen sie mit f(x|n; N; M) und 
haben 
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f 




Eine Zufallsvariable mit der Massefunktion f(x|n; N; M) 
heißt hypergeometrisch verteilt mit den Parametern n, N 
und M . 



4.3.4 Wenn X hypergeometrisch verteilt ist mit den Parame- 
tern n, N und M , gilt definitionsgemäß 



n 

EX = Y xf (x | n; N ; M) 
x=0 




Wegen 




hat man nun 




und wegen 

/ N-M 
\ n-x 



/ M- 1 \ / N-M \ 
M \ X- 1 ) \ n-x / 




/ (N-1) - (M-1) \ 

V (n-1) - (x-1) / 
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M-1 \ / (N-1 ) - (M-1 ) 

x-1 l ' v (n-1) - (x-1) 



N-1 
. n-1 



f (x-1 | n-1 ;N-1 ?M-1 ) 



folgt 



M n 

EX = n — 7 f (x-1 | n- 1 ;N-1 ;M-1) 

N L « 1 

x=1 

M 11-1 

= n — y f (y | n- 1 ;N- 1 ; M- 1 ) . 

N y=0 



Weil 

n-1 

l f (y | n-1 ;N-1 ;M-1 ) = 1 

y=0 



gilt, erhält man 



EX 



n 



M 

N * 



4.3.5 Wenn X hypergeometrisch verteilt ist mit den Parame- 
tern n, N und M , gilt definitionsgemäß 



var X = y (x-EX) f(x|n; N; M). 
x=0 



Durch Umformungen, die den in 4.3.4 durchgeführten 
analog sind, erhält man hieraus 



„ M , 1 

var X = n — ( 1 



Mv N-n 
N N-1 * 
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4.3.6 Zieht man n Kugeln aus einer Urne, die M rote 
und N - M nichtrote Kugeln enthält, so ist die Zahl X 
der in die Auswahl gelangenden roten Kugeln nach den Ab- 
schnitten 4.2.4 und 4.3.3 im Falle des Ziehens mit 
Zurücklegen binomialverteilt mit den Parametern n und 
und im Falle des Ziehens ohne Zurücklegen hy per geometrisch 
verteilt mit den Parametern n, N und M . In beiden Fäl- 
len besitzt X also den Erwartungswert 



Dagegen gilt 



— ) beim Ziehen mit Zurückle- 

gen 

M N-n 

jy) beim Ziehen ohne Zurück- 

legen. 

Die Varianz von X ist also beim Ziehen ohne Zurücklegen 
kleiner als beim Ziehen mit Zurücklegen. Den sog. Korrek- 
turfaktor 

N-n 

N-1 

der beim Ziehen ohne Zurücklegen auftritt, wollen wir we- 
gen 



var X 






»f n- 



N-n , i _ n x N 

N-1 1 N ' N-1 



1 



n 

N 



vernachlässigen, wenn der sog. Auswahlsatz n/N den Wert 
5 % nicht übersteigt. 

4.3.7 Aufschlußreich ist ein Vergleich der Massefunktionen 
f (x | n ; und f(x|n; N; M) . 
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SIS 




Es zeigt sich, daß bei f(x|n; N; M) die Wahrscheinlich- 
keiten stärker auf die Werte um nM/N konzentriert sind 
als bei f(x|n; . In Abb . 15 sind die Massefunktionen 
f (x | 8 ; 16; 8) und f(x|8; 0,5) dargestellt. 




Wenn der Auswahlsatz n/N klein ist - als Faustregel soll 
n/N < 0,05 benützt werden - gilt in guter Näherung 

f(x|n; N; M) = f(x|n; ~) 

für x=0, 1, ..., n . 



4.4* Approximation der Binomialverteilung und 
der hypergeometrischen Verteilung durch die 
POI SSON -Verteilung 

4.4.1 Vorgegeben sei X > 0 . Wir betrachten die Zahlen- 
folge 




Alle Elemente dieser Folge sind positiv; ihre Summe hat den 
Wert 1 . 
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Nun sei X eine Zufallsvariable mit der Eigenschaft 



W(X = x) 



e X für x = 0, 1 , 2, . . . 
0 sonst . 



Dann bezeichnet man X als POI SSON-verteilt mit Parameter 



4.4.2 X sei POISSON-verteilt mit Parameter X . Wir set- 
zen für beliebiges reelles x 

f (x | X) = W(X = x) . 

Nun sei X eine binomialverteilte Zufallsvariable mit der 
Massefunktion f(x|n;0) . n sei eine große Zahl und 0 

liege nahe bei 0 . Dann gilt in guter Näherung 

f ( x | n ; 0 ) = f ( x | n 0 ) 

für x = 0 , 1 , ..., n . 



1 ) 

In der mathematischen Statistik wird der Begriff "dis- 
krete Zufallsvariable" allgemeiner gefaßt. Dort heißt 
eine Zufallsvariable auch dann diskret, wenn es eine 
unendliche Folge x Q , x^ , ... gibt und 

W(X = x i ) >0 für i = 0, 1 , ... 



I W(X = x. ) = 1 
i=0 1 

gilt. Bei dieser Definition ist eine POISSON-verteilte 
Zufallsvariable diskret. 
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Wir betrachten zunächst ein Beispiel: 



Sei 6 = 0,001 der Ausschußanteil bei der Massenfertigung 
eines bestimmten Produktes. Dieser Fertigung wird eine 
Stichprobe vom Umfang n = 100 durch Ziehen mit Zurückle- 
gen entnommen. Die Anzahl X der Ausschußstücke in der 
Stichprobe ist dann binomialverteilt mit den Parametern 
100 und 0,001 . Man hat 



X 


| f (x | 100; 0,001 ) 

i 


f (x|0,1) 


0 


1 

0,9048 


0,9048 


1 


0,0906 


0,0905 


2 


0,0045 


0,0045 


3 


0,0001 


0,0002 


4 


0,0000 


0 , 0000 



Wir wollen die beschriebene Approximation begründen und be- 
trachten das Verhalten der Massefunktion f(x|n;0) bei 
Durchführung der Grenzübergänge n 0 0 . Diese Grenz- 

übergänge sollen so erfolgen, daß das Produkt n0 konstant 
bleibt; X verwenden wir als Symbol für die vorgegebene 
Konstante. Wir lassen also 0 "ebenso schnell" gegen 0 
konvergieren, wie wir n gegen 00 konvergieren lassen. 



Geben wir uns eine natürliche Zahl m vor. Für jede na- 
türliche Zahl n mit n > m gilt dann 



f ( m | n ; 0 ) = 



f (m- 1 | n ; 0 ) 



n! 



m! (n-m) ! 



e m (1 - e) n m 



(m- 1 ) ! (n-m+1 ) ! 



6 m_ 1 (i - e) n-m+1 , 



Wir bilden den Quotienten 

1 m 1 v 

f (m[ n ; 0 ) _ n-m+1 ^ 0 _ n n n 

f (m- 1 j n ; ©T m ' 1-0 m(1-0) 
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und erhalten 



lim 
n+°° 
n6 = X 



f (m[n;9) 
f ( m- 1 | n ; 0 ) 



m * 



Nun gilt 



f (0|n;6) = (£) 6° (1 



e) n = (i 



e) 



und damit 



lim f(O|n;0) = lim (1 - — ) = e 

n 

n-+°° n->°° 

nö = X 



Aus (1) und (2) ergibt sich 



lim f ( 1 | n ? 6 ) = Xe 

n -*oo 

n0=X 

Hieraus folgt wegen (1) 



lim f(2|n;0) 

n->°° 

n0=X 



und hieraus 



lim f ( 3 | n ? 0 ) 

n+oo 

nO=X 





Die Behauptung ist damit bewiesen. 

4.4.3 f(x|n;0) wird vielfach durch f(x 

wenn gilt 

n > 30 , 0 < 0,1. 



( 1 ) 



n 



( 2 ) 



n0) approximiert, 
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Für "kleine" Auswahlsätze 2. - als Faustregel möge dienen: 

^ < 0,05 - läßt sich die hypergeometrische Verteilung durch 

eine entsprechende Binomialverteilung annähern. Es ist da- 
her naheliegend, bei Vorliegen dieser Voraussetzungen auch 
die hypergeometrische Verteilung durch die POISSON-Vertei- 
lung zu approximieren. 

Um eine Vorstellung von der Güte der obigen Approximation 
zu vermitteln, sind in der folgenden Tabelle einige Werte 
der Wahrscheinlichkeitsfunktionen f(x|30; 0,1), 
f (x | 30; 600; 60) und f(x|3) nebeneinander angegeben 



X 


f (x| 30; 0,1) 


f ( x | 30 ; 600 ; 60) 


f (X I 3) 


0 


0,0424 


0,0390 


0,0498 


1 


0,1413 


0,1374 


0,1494 


2 


0,2277 


0,2295 


0,2240 


3 


0,2361 


0,2422 


0,2240 


4 


0,1771 


0,1813 


0,1680 


5 


0,1023 


0,1025 


0,1008 


6 


0,0474 


0,0456 


0,0504 


7 


0,0180 


0,0164 


0,0216 


8 


0,0058 

• 


0,0048 


0,0081 



4.5* Multinomialverteilung und polyhypergeome- 
trische Verteilung 

4.5.1 Eine Urne enthalte N Kugeln, von denen eine bestimm- 
te Eigenschaft 1 haben, N 2 eine Eigenschaft 2, ... bzw. eine 

Eigenschaft k. Wir ziehen n Kugeln und bezeichnen mit die 
Anzahl der gezogenen Kugeln mit Eigenschaft 1 , mit die An- 
zahl der Kugeln mit Eigenschaft 2, ... bzw. mit X^ die Anzahl 

der gezogenen Kugeln mit Eigenschaft k. Wenn n^ , t 

nichtnega.tive Zahlen sind mit 
k 

n = I n 
i=1 
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gilt 



W(X 1 =n 1 , 




beim Ziehen mit 
Zurück legen 



,X k =n k ) H 



V 




beim Ziehen 
ohne Zurück- 
legen 



Die erste Behauptung ergibt sich aus 1.6.8 . Um die zweite 
Behauptung zu beweisen, hat man das in 4.3.1 beschriebene 
Vorgehen geeignet zu modifizieren. 



Die Zufallsvariablen X^ besitzen also im 
Falle des Ziehens mit Zurücklegen die gemeinsame Masse- 
funktion 



h(x^, x 2 . 



Nl N 2 

X k |n; N' N' 



f. 



ni 



1 * 



k* 







falls x^ , . . . , x^. 
ganzzahlig und 
nichtnegativ sind 

mit y x. = n 
L i 



V 



sonst 



und im Falle des Ziehens ohne Zurücklegen 



h (x 



r *2' 



|n;N;N 1( N 2 



V 




Zufallsvariablen X^ , X^, . .., 



falls x^ , . . . , x^ 
ganzzahlig, nicht- 
negativ sind mit 

T x. = n 
L i 

sonst . 

X^ , deren gemeinsame Masse- 
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, N 1 N k 

funkt ion h^, x k |n? — / •••/ — ) ist, nennt man 

N 1 N k 

multinomialverteilt mit den Parametern n, -rr-, . .., — . 

N N 

Zuf allsvariablen , X 0 , . .., X^ heißen polyhyper geome- 
trisch verteilt mit den Parametern n, N, , N 2 , , 

wenn ihre gemeinsame Massefunktion gleich 
h(x 1f x 2 , x k l n ? N /‘ n 2 ' •••/ N k ) ist * 

4.5.2 Angenommen , die Zufallsvariablen X 1 , X , . . ., X 

N i k N, 

seien multinomialverteilt mit den Parametern n, * 

' N ' ’ * • 'Ti * 

Bei beliebig vorgegebenem i = 1, 2, k ist X^_ dann 

binomialverteilt mit den Parametern n und — , so daß 
folgt 



N . 

k , - -± ) . 

Jetzt seien die Zufallsvariablen X^ , X 2 , . .., X^ poly- 

hypergeometrisch verteilt mit den Parametern n, N, 

N i , N 2 , . . . , N^. . Dann ist bei beliebig vorgegebenem 

i = 1 , 2 , ..., k x^ hypergeometrisch verteilt mit den 

Parametern n, N und . Man hat folglich 



N . 

EX. = n — 
l N 






N . 
l 



N . 

EX. = n -1 
l N 

N . 

var X. = n (1 
1 N 



N. 

1 

N 



N-n 
N-1 * 



4.5.3 Wenn X^ , X^ f . .., X^ multinomialverteilt sind 
mit den Parametern n, N^/N, N^/N, ... N^/N , gilt 



EX X - t ni f N l\ X Y N 2^ X2 

EX 1 X 2 ^ Xl ! x 2 ! • • -x k ! \ N / V N 






N 1 N 2 

n(n_1) IT IT l 



(n- 2 ) ! 






x ,-1 



(x .-1 ) ! (x -1 ) ! x , ! • • • x. A’n/ 
1 2 3k 



V N / 



x .-1 



N 3 \ X 3 



\f k 

N / * 
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mit 



Dabei ist über alle ganzzahligen x^ , x 2 , . .., x^ 

k 

x. > 1 , x 0 > 1 und J x. = n zu summieren. Man 
1 = ' 2 = i=i 1 

erhält offensichtlich 

N N 

EX 1 X 2 = n (n-1 ) -J. -jf . 



Hieraus folgert man 

N 1 N 9 N 1 N 9 

cov(X 1 ,x 2 ) = n (n-1 ) -u ^ - n 2 Jj. ^ 



ll Ü! 

N N * 



Entsprechendes gilt für cov (X^X^) bei beliebigen i,j = 
1 , 2 , . . . , k mit i f j . 



4.5.4 Wenn X^ , X 2 , ..., X^ polyhypergeometrisch ver- 
teilt sind mit den Parametern n, N, N^, Nj, . .., N^, gilt. 



e Xi x 2 = l 



N, \/N 



und wegen 



f . \ / N . 

r X ) x. = N.( 1 

: . / l x . 



N. - 1 



folgt 



EX 1 X 2 = 



N 1 N 2 n(n-1 ) 
N (N- 1 ) 



X 1 X 2 



i = 1, 2 



N r 1 

X r 1 



n 2 -i 

X 2“ 1 



cm 



N-2 

n-2 



Dabei erstrecken sich alle Summationen auf ganzzahlige 

k 

x^ , x 2 , ..., x^ mit x^ > 1 , x 2 > 1 und J x^ = n . 
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Es folgt 



EX 1 X 2 ■ ^TT‘ N 1 N 2 

cov (X r X 2 ) = 
und allgemein für i,j = 1 
cov (X.,X.) = -n Y 



• N 1 N 2 - 



2 , 



N j 



N-n 

N-1 



2 

"T ‘ N 1 N 2 

N Z ' ^ 



. / n ? i f j 



12 . 

N 



N-n 

N-1 



4.6 Aufgaben 

4.6.1 Eine faire Münze wird 8-mal geworfen. 

a) Wie groß ist die Wahrscheinlichkeit, daß 

a^) genau 4-mal 

a 2 ) weniger als 4-mal 

a^) wenigstens 4-mal 

Kopf erscheint? 

b) Berechnen Sie den Erwartungswert und die Standardab- 
weichung für die Zahl der auftretenden "Köpfe". 

Lösung : 

Die Zahl X der "Köpfe", die beim 8-maligen Werfen der 
Münze auftreten, ist binomialvertei lt mit den Parametern 
n = 8 und 9 = — . 

a) Die Werte der Massefunktion f(x|8; j) können wir der 
Tabelle in 4.2.1 entnehmen. Wir erhalten 



a 1> 


W (X = 


4) 


= f ( 4 | 


00 


= 0,2734 . 


a 2 ) 


W(X < 


4) 


3 

= I 


f (X ! 8; 










o 

II 

X 












= 0,0039 + 0 


,0312 + 0,1094 + 0,2188 
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a 3 ) W(X > 4) = 1 - W(X < 4) = 1 - 0,36 33 = 0,6367. 

b) Für den Erwartungswert und die Varianz von X ergibt 
sich 

EX = n0 = 8 * j = 4 
var X = n6(1 - 0 ) =8 • — • = 2 . 

Die Standardabweichung beträgt also 
/var X = /2 = 1,414. 



4.6.2 Eine aus 500 Stücken bestehende Sendung eines 
Massenartikels weise 10 % Ausschuß auf. Man zieht 
n = 30 mal ohne Zurücklegen. 

a) Wie viele fehlerhafte Stücke hat man zu erwarten? 

b) Wie groß ist die Varianz der Zahl der ausgewählten 
fehlerhaften Stücke. 



Lösung : 

In der Sendung befinden sich 50 fehlerhafte Stücke. Die 
Zufallsvariable X , die angibt, wie viele schlechte Stücke 
ausgewählt werden, ist also hypergeometrisch verteilt mit 
den Parametern n = 30, N = 500 und M = 50 . 

a) Die Zahl der zu erwartenden fehlerhaften Stücke ist 



EX 



M 
n N 



30 



50 

500 



3 - 



b) Die Varianz von X berechnet sich zu 



var X 



M 
n N 



(1 



M. N-n 
N N-1 



= 30 



50 

500 



(1 



50 . 500-30 
500 500- 1 



2,543 . 
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4.6.3 Mit welcher Wahrscheinlichkeit gewinnt man mit 
einer Tippreihe im Lotto ("6 aus 49") in den einzelnen 
Gewinnklassen? 



Lösung : 

A i bezeichne das Ereignis, daß man im i-ten Rang ge- 
winnt (i = 1, 2, . .., 5) . Die Tippreihe enthält also bei 



A^ : 6 Gewinnzahlen 

A^: 5 Gewinnzahlen und die Zusatzzahl 

A^ 2 5 Gewinnzahlen und nicht die Zusatzzahl 

A.: 4 Gewinnzahlen 

4 

Aj- : 3 Gewinnzahlen . 



Die Wahrscheinlichkeit, mit der die Tippreihe i Gewinn- 
zahlen enthält, ist gleich der Wahrscheinlichkeit, beim 
Ziehen ohne Zurücklegen von n = 6 Kugeln aus einer mit 
6 roten und 43 weißen Kugeln gefüllten Urne genau i rote 
Kugeln zu erhalten. Daher ist 



W ( A 1 ) 







0,000 000 0715 . 



Bei 5 Gewinnzahlen gewinnt man im 2 
also 



^ ^ 2 ^ ^3 



g)(V) ^ 
( 4 6 9 ) g 9 > 



oder 3. Rang; es ist 



0,000 0184 . 



Die Wahrscheinlichkeit, mit der die Tippreihe 5 Gewinnzahlen 
und die Zusatzzahl enthält, ist gleich der Wahrscheinlich- 
keit, beim Ziehen ohne Zurücklegen von 6 Kugeln aus einer 
mit 6 roten, einer schwarzen und 42 weißen Kugeln gefüllten 
Urne die schwarze Kugel und noch 5 rote Kugeln zu erhalten. 
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Daher gilt 



W(A 2 ) 






v, 5 ; 



(49) 
\ 6 / 



42 ^ 

0 J 



6 

= 0,000 000 429 

(V 



und es folgt 



W(A 3 ) = W(A 2V yA 3 ) - W(A 2 ) = 0,000 018 . 



Schließlich ist 



W(A 4 ) 




15 • 903 

V 6 J 



= 0,000 969 



und 



W(A 5 ) 




20-12 341 

(V) 



0,01765 . 



Die Wahrscheinlichkeit dafür, daß man überhaupt gewinnt, 
ist also 

5 5 

W ( \J A . ) = l W (A . ) = 0,0186 
i=1 1 i=1 1 



4.6.4 Eine Sendung von 10 000 Stück eines Massenbedarfs- 
gutes enthält 3 % Ausschuß. Es ist vereinbart, daß der 
Empfänger die Lieferung nur abzunehmen braucht, wenn von 
100 zufällig entnommenen Stücken nicht mehr als c 
schlecht sind. 

a) Mit welcher Wahrscheinlichkeit wird die Sendung abge- 
nommen, wenn c = 3 vereinbart ist? 

b) Wie groß muß c mindestens gewählt werden, wenn die 
Abnahmewahrscheinlichkeit 0,95 übersteigen soll? 
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Lösung : 



a) Die Sendung enthält 300 schlechte Stücke. Die Anzahl 
X der ausgewählten schlechten Stücke ist daher hypergeome- 
trisch verteilt mit den Parametern n = 100, N = 10 000 
und M = 300 . Die Sendung wird abgenommen, wenn X < c 
gilt. Die Wahrscheinlichkeit für dieses Ereignis ist 

c 

W(X < c) = l f (x | 1 00 ; 10 000; 300) . 

x=0 

Die Summanden f(x|l00; 10 000; 300) lassen sich wegen der 
großen Werte der Parameter nur mit erheblichem Aufwand be- 
rechnen . 

Wir prüfen deshalb die Voraussetzungen für die Approximation 
der hypergeometrischen Verteilung durch die POISSON-Vertei- 
lung. Da 

n = 100 > 30 

| = 0,03 < 0,1 

£ = 0,01 < 0,05 

gilt, sind die Approximationsbedingungen erfüllt. Folglich 
hat man 

f (x| 100; 10 000; 300) f» f(x|100 • -|q 3 qq 0 ) = f(x|3) 

und wir erhalten 



3 

l f (x | 3) = 0,6472 . 
x=0 

b) Wenn man erreichen will, daß die Abnahmewahrscheinlich- 
keit 95 % übersteigt, muß c so groß gewählt werden, 
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daß 



c 

l f(x|3) > 0,95 
x=0 

5 

gilt. Wegen £ f(x|3) = 0,9160 und f ( 6 | 3 ) = 0 

x=0 

übersteigt die Abnahmewahrscheinlichkeit den Wert 
bereits bei c = 6 . 



0504 

0,95 
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5. Nomnaiverteilte Zufallsvariablen und 
Zentraler Grenzwertsatz 



5.1 Normalverteilung 

5.1.1 Vorgegeben seien eine beliebige reelle Zahl y und 
eine positive Zahl o . Wir betrachten die Funktion 

i 2 

. 4 (^) 

/ i \ I Z o 

tp ( x j y ; a ) = — e 

/2 TT O 

Die Funktion cp(xjy/a) ist offensichtlich für alle x 
positiv. In Abb . 16 ist ihr Verlauf für verschiedene Werte 
y und ü angegeben. 



<p(x|0; 1) 
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Es läßt sich zeigen, daß die Abszissenachse und die durch 
die Funktion <p(x|y;a) festgelegte Kurve ein Flächenstück 
einschließen, das den Inhalt 1 hat, d. h. 



/ (p ( x | y ; ö ) dx = 1 . 

Die Dichtefunktion <p(x|y,a) verläuft symmetrisch zur Ge- 
raden x = y . Von der Symmetrieachse aus nehmen ihre Wer- 
te nach beiden Seiten monoton ab und gehen für x -* +°° ' 
und x+— 00 gegen 0 . An den Stellen x = y + o und x = y - a 
liegen Wendepunkte. Die Dichtefunktion cp(x|y;a) verläuft 
um so steiler, je kleiner a ist. Eine Änderung des Para- 
meters y dagegen bewirkt eine Parallelverschiebung ent- 
lang der x-Achse. 

Man vergleiche hierzu FISZ (1973), s. 177 ff. und dortige 
Verweise . 

5.1.2 Eine stetige Zufallsvariable X mit der Dichte- 
funktion cp(x|y;a) wird ( yj o ) -normalverteilt oder auch 
normalverteilt mit den Parametern genannt. 

Die Verteilungsfunktion einer (y , o ) -normalverteilten Zu- 
fallsvariablen bezeichnen wir mit <f> (x | y ; a ) 

x 

<p (x | y ; a ) = / q>(y|y?a) dy . 



5.1.3 Es gilt 



• (x | y ? a ) = «fr I 0; 1) . 



Um das nachzuv/eisen , setzen wir 



z (y) 



Dann gilt 
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dz _ J_ 
dy o 

lim z (y ) = -« , z (x) = 

y^-co 



und mit der Substitutionsregel für bestimmte Integrale folgt 



4> ( x | y ; o ) = 



/2 TT ' 



- 1 (XZÜ) 

2 v ; 



dy 



x-y 




2 

2 



2 

z 



g dz 



x-y 




e 



2 

2 



z 



2 



dz 



= * (2-ü | 0; 1 ) 



Eine (0; 1 ) -normalverteilte Zuf allsvariable wird standard- 

normalverteilt genannt. Wir setzen zur Abkürzung 



cp(x) = cp ( x | 0 ; 1) 




2 



x 



4> ( z ) = <J> ( z | 0 ; 1) 





dx . 



Das oben abgeleitete Transformationsgesetz läßt sich dann 
folgendermaßen schreiben 

4> (x | y ; a ) = <p (~-^) . ( 1 ) 
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Wegen (1) kann man die Werte der Verteilungsfunktion 
<|>(x|y;o) einer beliebigen Normalverteilung mit einer Tabel- 
le der Funktion 4> ( z ) bestimmen. Zum Beispiel gilt 

<t> ( 1 2 | 10; 2) = 4» f- 1 - 2 - " 1 - 0 ) = <4(1) = 0,8413 . 

5.1.4 Es sei z > 0 . Da die Funktion cp (x) symmetrisch 
zur Achse x = 0 verläuft, gilt 

<M-z) = 1 - 4>(z) • (2) 

(Vgl. Abb. 17.) 



<^(x) 




0 z 



Abb . 1 7 

Es genügt also, die Funktion 4>(z) für positive z-Werte 
zu tabellieren; die Werte für negative Argumente ergeben 
sich dann nach (2) . Zum Beispiel ist 

<f> (-1 ) = 1 - ( 1 ) = 1 - 0,8413 = 0,1587 . 

5.1.5 X sei eine (y , a ) -normalverteilte Zufallsvariable. 
Die Wahrscheinlichkeit, mit der X Werte annimmt, die um 
höchstens z*o (z > 0) vom Erwartungswert y abweichen, 
ist nur von z abhängig, und zwar gilt wegen (1) und (2) 
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5.1.6 Für 0 < a < 1 sei z der Wert mit 



a 



+ oo 

/ cp (x) dx = a . 
z 

a 



(Vgl. Abb. 19.) 



<p(x) 




Anhand einer Tabelle der Funktion <f>(z) bestimmt man z 

a 

aus der Gleichung 

*(z a ) = 1 - a . (3) 

Im Falle a = 0,025 hat man beispielsweise 

$ ( z o ,02 5 ^ = 1 " °' 025 = 0,975 
und daher 



Ist X eine (y , o) -normalverteilte Zufallsvariable, so gilt 
nach (1) , (2) und (3) 



W({X > y + z a/2 o}) 



'< Z «/2> 



a 

2 
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W({X < y - Z a/2 o}) = ♦(-3 o/2 > = 2 

also 

W({v ” Z a/2° = X = y + Z a/2° }) = 1 ” a • 
(Vgl. Abb. 20.) 




Beispielsweise gilt (a = 0,05) 

W ( { y “ 1,96a < X < y + 1,96a }) = 0,95 . 

5.1.7 X sei (y , a ) -normaiverteilt . Wir wollen zeigen 
dann 

EX = y 

v 2 
var X = a 

gilt . 



X besitzt die Dichte 




Nun gilt 



/ xf (x) dx 



1 

/2 tt' 



/ 



x-y 

G 



e 



2 

2 



x- 

G 



2 

dx 



+ 



y 



^ 2 77 G 



/e 



1 / X-y 

2 ' G 



2 



dx 



und da 



f(x) = <p(x|u;g) eine Dichtefunktion ist 



oo 

/ xf(x)dx 



1 

/2 tt' 



OO 

/ 



:-y 



G 



2 




dx + 



y . 



Mit 



y 



2 

2 



<x?> 



2 



ist aber erfüllt 



/ 

y 



:-y 



2 

2 






dx 



g / e ^ dy 
o 



G 



y 

/ 



-y 



2 

2 






dx 



o 

g / e ^ dy = -g 



so daß folgt 



/ 



x-y 

G 



e 



2 

2 






2 



dx 



0 



und hieraus 



EX = / xf (x) dx = y . 
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Weiter hat man 



x f (x)dx = / (x-y ) z £ (x) dx + 2y f xf (x)dx - y 2 / f (x) dx 

= / (x-y ) 2 f (x) dx + y 2 . 



Es folgt 



2 1 ( X ~ |J ) 
/ x 2 f (x)dx = y 2 + -2_ ; (-2LIÜ) (-2SZ1Ü) e 2 0 

/Tn ° ° 



und mit 



erhält man 



2 

2 2 2 - 
/ x f(x)dx = y + — — / (-y) (-y)e 2 dv 

/2 TT 



Partielle Integration liefert 



2 

2 - 

/ x 2 f(x)dx = y 2 + — fe 2 dy 

/27 



2 2 

y + ö 



Folglich gilt 



2 2 2 2 
var X = v + o - y = o . 



Eine (y ;a ) -normalverteilte Zufallsvariable besitzt also 

2 

den Erwartungswert y und die Varianz c 
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5.2 Funktionen normalverteilter Zufallsvariablen 



5.2.1 Ist X eine ( y , o ) -normalverteilte Zuf allsvariable , 
so ist auch jede lineare Funktion aX + b mit a f 0 nor- 
malverteilt: Im Falle a > 0 etwa gilt für beliebiges x 



W(aX + b < x) = W(X < 2^) 



■ ( I y ; o ) = * ( ) 

a. aa 



= <j) (x | ay + b ; aa ) . 



5.2.2 Die obige Aussage läßt sich verallgemeinern. Wir neh- 
men im folgenden an, X^ , X 2 , . .., X n seien unabhängige 
normalverteilte Zufallsvariablen. Dann ist auch jede lineare 
Funktion 

Z = a + a.X 1 + ... + aX 
oll n n 

normalverteilt (bzw. im Falle a^ = ... = a n = 0 konstant) . 
Diese wichtige Aussage kann hier nicht bewiesen werden. Für 
einen Beweis verweisen wir auf FISZ (1973), S. 181. Wir kön- 
nen aber die Parameter 

2 

y = EZ und a = var Z 
der Normalverteilung von Z berechnen. 

Sind y 1 , y 9 , . y die Erwartungswerte und a., a 0 ,...,a 
i z n iz n 

die Standardabweichungen von X^ , , ..., X n , so gilt 

EZ = a o + a 1 EX 1 + ... + a n EX n = a^a^^ . . . + a^ 

und mit der Unabhängigkeit der Zufallsvariablen X 1 , X 2'***' X n 
folgt aus 3.4.7 (4) 
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var Z 



= a 1 var X 1 + ... + var X 

Ti n n 



2 2 



2 2 



a 1 °i + ••• + a n °n’ 



Folglich ist Z normalverteilt mit dem Erwartungswert 



a o + 



+ a y 
n n 



und der Varianz 



2 

o 




+ 



a 



2 

n J 



Aus den obigen Aussagen folgt insbesondere: Für eine Stich- 
probe (X i , X^ / . . . , X ) aus der Verteilung <J> (x | y ; a ) ist 
das Stichprobenmittel 

2 

und Varianz — . 

n 



X = n (X 1 



X 2 + 



• + V 



normalverteilt mit Erwartungswert 



5.2.3 Nun nehmen wir an, 



Z 1 ' Z 2' - ' Z k 

seien unabhängige standardnormalverteilte Zufallsvariablen. 
Wir setzen 

2 2 2 
U = Z/ + + ... + Z, . 

1 2. k 

Dann besitzt die Zufallsvariable U die Dichtefunktion 

r k-2 _ u 

2 2 

! c u e für u > 0 

f k (u) = ^ k 

lo sonst . 

Dabei ist c^ ein Normierungsfaktor, d. h. 



oo k-2 _ u 

I u 2 e 2 du 
0 
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Zufallsvariablen mit der Dichtefunktion f,(u) nennt man 

2 2 * 

X^, -verteilt oder auch x -verteilt mit k Freiheitsgraden 

Für a mit 0 < a < 1 definieren wir die Zahl 



2 

X 



k ; a 



durch die Gleichung (vgl. Abb . 21) 



2 f k (u)du = a . 
x k ; a 



f k (u) 




5.2.4 Wir nehmen an, 



J 1' ° 2 ' 



seien unabhängige standardnormalverteilte Zufallsvariablen 
Wir setzen 



T 




+ z l ) 



Dann besitzt T die Dichtefunktion 
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k+1 

2 



< t < 



<P. (t ) = d (1 + i-) 
k K k 

Dabei ist d k wiederum ein Normierungsfaktor, der sich aus 
der Gleichung 



/ <P k (t)dt = 1 
bestimmten läßt. 



Die Funktion cp (t) konvergiert für k -► 00 gegen die Dich- 
tefunktion cp (t) der Standardnormalverteilung. Bei k > 30 

braucht man bei der hier angestrebten Genauigkeit zwischen 
<p (t) und cp (t) nicht zu unterscheiden (vgl. Abb . 22). 




Abb. 22 



Zufallsvariablen mit der Dichtefunktion cp k (t) heißen 

t-^-vertei 1 t oder auch STUDENT-t-verteilt mit k Freiheits- 
graden. 

Für a mit 0 < a < 1 definieren wir Zahlen 



k ; a 



durch die Gleichung (vgl. Abb. 23) 



I cp ( t ) dt = a . 

t, K 
k ; a 
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^(tl 




Für die Anwendungen wichtig ist die folgende Aussage: 

Wenn (X^ , , . .., X ) eine Stichprobe aus der Verteilung 

<J> (x | y ; o ) ist und 



i n 

= 1 I 

•n u 



i=1 



1 

n-1 



n 

I 

i=1 



(X ± - X) 2 



gesetzt wird, ist die Zufallsvariable 



X - y 

s //k 



STUDENT -t- verteilt mit n-1 Freiheitsgraden. 

5.2.5 Die Zufallsvariablen , . . . , , Z^ , . 

seien unabhängig standardnormalverteilt. Wir setzen 






F = 



12 2 
” ( Y 1 ^ + Y, + 
ml 2 



2 

+ Y ) 
m 



K (Z 1 2 + Z 2 2 + 



+ z 



Dann besitzt die Zufallsvariable F die Dichtefunktion 
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m-2 

2 



m+n 

2 



für x > 0 



m,n 



(x) 



c X 
m,n 



(1 



+ 



m 

n 



x) 



sonst . 



Der Normierungsfaktor 



c läßt sich aus der Gleichung 

m,n ^ 



0 



ip (x)dx 
m,n 



1 



bestimmen . 



Eine Zufalls variable mit der Dichtefunktion \p (x) 

m, n 

heißt F-verteilt mit m und n Freiheitsgraden . 

Für a mit 0 < a < 1 definieren wir Zahlen 



F 

m , n ; a 



durch die Gleichung (vgl. Abb . 24) 



F 

m , n ; a 



\p (x) dx 
m , n 



a . 






(x) 
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5.3 Zentraler Grenzwertsatz 



5.3.1 X<j , / .../ X^ seien unabhängige Zuf allsvariablen . 

Aus 5.2.2 folgt, daß das arithmetische Mittel 



dieser Zufallsvariablen jedenfalls dann normalverteilt ist, 
wenn die Zufallsvariablen X 1 , X 2 , ..., X n selbst normal- 
verteilt sind. Es ist nun von großer Bedeutung, daß X 
schon unter sehr schwachen Voraussetzungen hinsichtlich 

der Zufallsvariablen X n , X 0 , ..., X annähernd normal- 

i z n 

verteilt ist. 



5.3.2 Nehmen wir beispielsweise an, ein echter Würfel wer- 
de n-mal ausgespielt. Für i = 1, 2, ..., n sei X^ die 
beim i-ten Wurf auftretende Augenzahl. Die Zufallsvariablen 
X^ , X 2 , . . . , X^ sind unabhängig und besitzen alle den Er- 
wartungswert 3,5 und die Varianz 2,917 . Nach Abschnitt 

3.5.3 gilt also für X = — Y X. 

^ n L l 

EX = 3,5 



In Abb . 25 sind für n = 1, 2, 3 über den möglichen Aus- 
prägungen von X Säulen gezeichnet; der Flächeninhalt einer 
Säule ist gleich der Wahrscheinlichkeit mit der X die 

der Säule zugeordnete Ausprägung annimmt. Im übrigen ist in 

5"'| 7» 

der Abbildung der Verlauf der Funktion <p(x|3,5;/ — — ) 
für n = 1, 2, 3 angegeben, die Dichte einer normalver- 
teilten Zufallsvariablen also, die denselben Erwartungswert 
und dieselbe Varianz wie X besitzt. 
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5.3.3 Aufgrund der Abb. 25 wird man sagen, X sei im 
Falle n = 3 näherungsweise normalverteilt. Und man 
wird vermuten, daß die Verteilung von X für großes n 
hinreichend genau durch Angabe einer geeigneten Normalver- 
teilung zu beschreiben ist. Daß diese Vermutung richtig ist, 
ergibt sich aus dem folgenden Satz, der üblicherweise als 
Zentrale? Grenzwertsatz bezeichnet wird: 

Wenn (X , X 0 , ..., X ) eine Stichprobe ist mit EX. = y , 

2 n 1 

var X. = a (i = 1, 2, . . . , n) , ist X = - l X, bei 

1 n . „ i 

a 1=1 

großem n annähernd (y; — ) -normalverteilt 

Zn 



W(X < x) « <j> (x | y ;— — ) . ( 1 ) 

Zn 

Der Name "Grenzwertsatz" rührt daher, daß die Verteilungs- 
funktion der Standardisierung von X für n -*• 00 gegen 
die Funktion 4>(z) konvergiert. Der Beweis des Zentralen 
Grenzwertsatzes erfordert einen beträchtlichen mathemati- 
schen Aufwand. Wir verweisen auf FISZ (1973), S. 235 ff. 

( 1 ) besagt, daß man bei großem n zwischen der tatsäch- 
lichen Verteilungsfunktion von X und <Mx|y;— £= 7 ) nicht 

/rv 

zu unterscheiden braucht. Bei der von uns angestrebten 
Rechengenauigkeit dürfte es gerechtfertigt sein, n je- 
denfalls dann als "groß" im Hinblick auf die Approximation 
(1) anzusehen, wenn n > 50 gilt. 

5.3.4 Die Voraussetzungen des oben angegebenen Zentralen 

Grenzwertsatzes lassen sich wesentlich abschwächen. X und 
n 

damit auch Z X^ sind schon dann annähernd normalverteilt , 
wenn die Zufallsvariablen X^ , X^r •••/ X n unabhängig sind 
und Varianzen haben, die "nicht zu sehr" voneinander ver- 
schieden sind (vergl. FISZ (1973), S. 241 ff.). Diese allge- 
meinere Fassung macht verständlich, weshalb man in der Praxis 
so oft normalverteilte Zufallsvariablen beobachtet. Diese Zu- 
fallsvariablen ergeben sich nämlich aus einer großen Zahl un- 
abhängiger (und unkontrollierbarer) Einflüsse , die sich additiv 
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überlagern. Für die von uns im folgenden behandelten An- 
wendungen des Zentralen Grenzwertsatzes ist die obige enge 
Fassung ausreichend. 



5.3.5 Wir kommen auf das Würfelbeispiel zurück. Nach dem 
Zentralen Grenzwertsatz ist X bei großem n annähernd 
I ~ 2 917 k 

(3,5;/ — ^ ) -normalverteilt . Um eine Vorstellung von der 

Genauigkeit der Approximation (1) bei nicht allzu großem 
n zu gewinnen, vergleichen wir im folgenden die tatsächli- 
che Verteilungsfunktion F(x) von X für n = 30 mit 

der Verteilungsfunktion <j> ( x [ 3 , 5 ; / ) . 



X 


F(x) 


* (x| 3,5;/ — ) 


2,6 


0,0021 


0,0019 


2,7 


0,0057 


0,0051 


nj> 

00 


0,01 39 


0,0124 


2,9 


0,0305 


| 0,0271 


3,0 


0,0607 


0,0544 


3,1 


0,1100 


0,0998 


3,2 


0,1826 


0,1680 


3,3 


0,2791 


0,2606 


3,4 


C , 39 51 


0,3742 


3,5 


0,5212 


0,5000 


3,6 


0,6452 


0,6258 


3,7 


0,7556 


0,7394 


u> 

00 


0,8444 


0,8320 


3,9 


0,9089 


0,9002 


4,0 


0,9512 


0,9456 


4,1 


0,9763 


0,9729 


4,2 


0,9895 


0,9876 


4,3 


0,9958 


0,9949 


4,4 


0,9985 


0,9981 
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Wir bleiben beim betrachteten Würfelbeispiel und nehmen an, 
es sei die Wahrscheinlichkeit dafür gesucht, daß sich bei 
100-maligem Ausspielen eine durchschnittliche Augenzahl von 
höchstens 3,6 ergibt. 

Die durchschnittliche Augenzahl X ist unter dieser 
Voraussetzungen offenbar (3,5;/ -normalverteilt. 

Die gesuchte Wahrscheinlichkeit 

W(X < 3,6) 



ist daher in guter Näherung gleich 



_ i , r . / 2,917' 
( 3 , 6 | 3 , 5 , / ^ qq 



) = 



■ .. 1 



/ 



2,917 

100 



/2 , 9 1 7 ' 



-) 



= <f> (0,59) = 0,7224. 



5.3.6 (X^ X 2 , ..., X R ) sei eine Stichprobe mit EX i = y , 
var X.^ = a 2 (i = 1, 2, . . . , n) . Dann ist nach 5.3.3 X bei 

großem n annähernd (y ,—^—) -normalverteilt . Folglich ist 

/n 



x Z-E (2) 

%n 

annähernd standardnormalverteilt. In (2) ersetzen wir 

2 

nun o durch S . Dabei spielt es keine Rolle, ob S 
als Abkürzung für 



n 



I 



i = 1 



(X ± - X) 2 



oder als Abkürzung für 



1 

n-1 



n 

l 

i = 1 



I (X, 



X) 



2 
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benützt wird; entscheidend ist, daß der Parameter a 
ersetzt wird durch irgendeine Zuf allsvariable , die stocha- 
stisch gegen o konvergiert. Die Zufallsvariable 



X - p 




die sich durch die Ersetzung ergibt, ist annähernd standard- 
normalverteilt. 

Einen Beweis dieser Aussage, von der wir später Gebrauch 
machen werden, findet man beispielsweise bei FISZ (1973), 

S. 279 ff. 



5.3.7 Jetzt seien . . . , X^ unabhängige BEPJsfOULLI- 

verteilte Zufallsvariablen mit EX^ = e (i = 1, 2, . . . , n) . 

Dann ist (X^ , X ^ , . .., X ) eine Stichprobe und 



ist als Stichprobenanteil zu interpretieren. Weil 
var X ^ = 9(1 - 0 ) gilt für i = 1 , 2 , . . . , n , folgt aus 
dem Zentralen Grenzwertsatz in 5.3.3 , daß P bei großem 
Stichprobenumfang n annähernd 

( 0 , / — 1 ■ 6 ) -normalverteilt 



ist; natürlich können wir statt dessen auch sagen, 



P - 0 



/ 



e (1-0) 

n 



sei bei großem n annähernd standardnormalverteilt. 
Weil in der Summe 

I (X i - X) 2 = l (X i - p) 2 
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nP-mal der Summand 



(i - p ) 2 

und (n-nP)-mal der Summand 
(0 - P) 2 = P 2 

vor kommt , hat man 

£ l(x ± - X) 2 = 1 [nP ( 1 - P) 2 + (n - nP ) P 2 ] 
= P ( 1 - P) . 

Nach 5.3.6 ist daher 




bei großem n annähernd standardnormalverteilt. 

Nach der grundsätzlichen Vereinbarung in 5.3.3 wird man 
n jedenfalls als groß ansehen, wenn n > 50 gilt. Wenn 0 
nicht zu nahe bei 0 bzw. 1 liegt, sind Approximationen 
aber auch bei kleinerem Stichprobenumfang n zulässig. Wir 
wollen sie unter der Voraussetzung 

0,1 < 0 < 0,9 

bereits für einen Stichprobenumfang von n = 30 akzeptieren. 

5.3.8 Beispiel: Ein echter Würfel werde 80-mal geworfen. 

Gefragt sei nach der Wahrscheinlichkeit dafür, daß höchstens 
20-mal die Augenzahl 6 beobachtet wird. 

Mit P sei der Anteil der Würfe bezeichnet, die die Augen- 
zahl 6 liefern. Nach 5.3.7 ist P annähernd («i ; -i)- 
normalverteilt , weil man 
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hat. Nun ist die Anzahl der beobachteten Sechser genau dann 
gleich 20, wenn P = 0,25 gilt. Gesucht ist also die Wahr- 
scheinlichkeit 



W(P < 0,25) . 

Diese ist wegen n = 80 > 30 in guter Näherung gleich 
<f> (0,25|i ; jj) = * (2) = 0,9772 . 



5.4* Approximation der Binomialverteilung und 
der hypergeometrischen Verteilung durch die 
Normalverteilung 



5.4.1 Die Zufallsvariablen , X . .., X^ seien unab- 
hängig und BERNOULLI-vertei lt mit dem Parameter 0 . Bei 

großem n ist der Stichprobenanteil P nach 5.3.7 an- 
nähernd 

(0, /UJ Ü ) -normalverteilt . 

v n 

Nach 5.2.1 ist dann X = nP annähernd normalverteilt mit 



den Parametern 


n0 und 


/n0 ( 1 - O ) 


, d. h. 




W(X < k) 


« <J) (k |n0 ? 


v'n0 (1 - 0 )‘ ) 


o 

ii 


. , n 



Andererseits ist X nach 4.2.1 binomialverteilt mit den 
Parametern n und 0 

k 

W(X < k) = l f ( m | n ; 0 ) k = 0, 1, n. 

m=0 

Folglich kann die Binomialverteilung für großes n durch 

die Normalverteilung approximiert werden 
k i 

£ f ( m | n ; 0 ) « <J> ( k | n 0 ; /n 0 ( 1 - ©T ) k = 0, 1 , . . . , n . 

m=0 
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5.4.2 Die betrachtete Approximation wird i. a. erheblich 
verbessert, wenn der Wert der Verteilungsfunktion 
<J>(x|n6; /n6 (1 -0 ) ' ) nicht an der Stelle k , sondern an 
der Stelle x = k + j genommen wird. Diese Verbesserungs- 
möglichkeit wird durch Abb. 26 veranschaülicht , in der die 
Verteilungsfunktion F(x) der Binomialverteilung mit den 
Parametern n = 30 und 0 =0,5 und die Funktion 
+(x|15; /TTS) gezeichnet sind. 




Abb. 26 

Man darf davon ausgehen, daß für n > 30; 0,1 < 0 < 0,9 
die Gleichung 

k 

l f ( m | n ; 0 ) = <Mk + 4|n0; /n0(1 - 0)) , 0 < k < n (1) 
m=0 



in guter Näherung erfüllt ist. 

Die hypergeometrische Verteilung mit den Parametern n, N 
und M kann für großes n in ganz analoger Weise durch 
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0 , 1 



eine Normalverteilung approximiert werden. Für k = 

. . . , n gilt 

I f ( m | n ; N ; M) = <J> (k + j ' n -j n ^ ( 1 - ^) ) (2) 

m=0 



jedenfalls dann in guter Näherung, wenn die Bedingungen 
n > 30, — < 0,05 und 0,1 < 0 < 0,9 erfüllt sind. 

5.4.3 Die folgende Tabelle soll eine ungefähre Vorstellung 
von der Genauigkeit vermitteln, die von den vorangehend 
besprochenen Approximationen (1) und (2) erwartet wer- 
den kann. 



k 


k 

l f (x| 36 ; 0 , 5 ) 
x=0 


k 

l f (xj 36;720;360) 
x=0 


<p (k+-j | 1 8 ; 3 ) 


6 


0,0000 


0,0000 


0,0001 


7 


0,0002 


0,0001 


0,0002 


8 


0,0006 


0,0004 


0,0008 


9 


0,0020 


0,001 6 


0,0023 


10 


0,0057 


0,0047 


0,0062 


11 


0,0144 


0,0125 


0,01 51 


1 2 


0,0326 


0,0293 


0,0334 


13 


0,0662 


0,0614 


0,0668 


14 


0,1215 


0,1155 


0,1217 


15 


0,2025 


0,1964 


0,2023 


16 


0,3089 


0,3043 


0,3085 


17 


0,4340 


0,4323 


0,4338 


18 


0,5660 


0,5677 


0,5662 


19 


0,6911 


0,6957 


0,6915 


20 


0,7975 


0,8036 


0,7977 


21 


0,8785 


0,8845 


0,8783 


22 


0,9338 


0,9386 


0,9332 


23 


0,9674 


0,9707 


0,9666 


24 


0,9856 


0,9875 


0,9849 


25 


0,9943 


0,9953 


0,9938 


26 


0,9980 


0,9984 


0,9977 


27 


0,9994 


0,9996 


0,9992 


28 


0,9998 


0,9999 


0,9998 


j 


* 


: 


• 



5.5 Aufgaben 



5.5.1 Die Brenndauer von Glühlampen, die nach einem be- 
stimmten Verfahren heraestellt werden, sei normalverteilt 
mit dem Erwartunaswert 1200 -Stunden und einer Standardab- 
veichuna von 100 Stunden. 

a) Mit welcher Wahrscheinlichkeit liegt die Brenndauer 
einer Glühlampe 

a^ ) unter 1000 Stunden 

a 2 ) über IIOO Stunden 

a^) zwischen 1000 und 1500 Stunden? 

b) Für welches Intervall [l200-c, 1 200+c ] liegt die 
Brenndauer einer Glühlampe mit Wahrscheinlichkeit 0,90 
innerhalb der Intervallgrenzen? 

c) Alle Glühlampen mit einer Brenndauer von weniger als c 
Stunden gelten als Ausschuß. Wie aroß ist c , wenn das 

Produktionsverfahren durchschnittlich 10 o/o Ausschuß 
liefert? 



Lösung : 

Nach Voraussetzung hat die Brenndauer X der Glühlampen 
die Verteilungsfunktion <J>(x|l200; 100) . Es gilt also 

a.j ) W(X < 1000) = <J> (lOOOl 1200; 100) 

= 0( ? 2 2£ ~„1 2 5 2) = <f> (-2) =1 - (J>(2) 

100 

= 1 - 0,9772 = 0,0228 . 

2,28 o/o der Glühlampen besitzen eine Brenndauer von weni- 
crer als 1000 Stunden . 
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a 2 ) W(X > 1100) = 1 - W(X < 1100 ) 

= 1 - * (1100 1 1200; 100) = 1 - » ( UP 0 - ^ . 1 . 200 ) 

= 1 - ♦ (-1) = * (1) = 0,8413 , 

Für 84,13 o/o der Glühlampen liegt die Brenndauer höher 
als 1100 Stunden . 



a 



W(1000 < X < 1500) 



.1500 - 1200. 
{ 100 } 



' (1 500 1 1 200; 100) - <f> 



,1000 - 1200 , _ , 

( ioö ) = * (3) 



( 1000 | 1200 ; 100 ) 
- (- 2 ) 



= 0,9987 - (1 - 0,9772) = 0,9759, 



Die Brenndauer von 97,59 o/o der Glühlampen liegt zwischen 
1000 und 1500 Stunden . 



h) Es ailt für O < a < 1 



W ( 1 200 - Z a/2 # 100 = x = 1200 + z a/2 * 100 ) = 1 “«• 

Tm Falle a = 0,1 hat man ( <Kz c ) = 0,95 und damit 

o ,o5 

z o ,o5 = 1 ' 645 > 

W ( 1 200 - 1,645 . 100 < X = < 1200 + 1 ,645 • lOO) = 0,9 

d. h. X fällt mit der Wahrscheinlichkeit 0,9 in das 
(symmetrisch um EX = 1200 gelegene) Intervall 

[ 1 035,5 ; 1 364,5 ] . 

c) Fs soll c so bestimmt werden, daß 

W (X < c) =0,1 



ailt. T,7 egen 



W(X < 1200 - z • 100) = a 
= a 



O < a < 1 
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hat man für a = 0,1 (<J>(z -) = 0,9 und damit 

W(X < 1200 - 1 ,28 • 100) = 0,1 . 

Es gilt daher 

c = 1200 - 128 = 1072 . 

Den Ausschuß bilden also alle Lampen mit einer Brenndauer 
von weniger als 1072 Stunden . 

5.5.2 Eine Maschine besteht aus zwei voneinander unabhän- 
gigen Teilen A und B . Sie kann nur eingesetzt werden, 
solange beide Teile funktionieren. Die Lebensdauer von Teil 
A sei (350; 50) -normalverteilt , die von Teil B (400; 25) 
-normalverteilt . 

a) Mit welcher Wahrscheinlichkeit arbeitet die Maschine 
noch nach 400 Betriebsstunden? 

b) Wie groß ist die Wahrscheinlichkeit dafür, daß Teil A 
vor Teil B defekt ist? 

Lösung: 

Wir bezeichnen mit die Lebensdauer von Teil A und 

mit X ß die Lebensdauer von Teil B . X A und X R sind 
nach Voraussetzung unabhängige normal verteilte Zufallsva- 
riablen. 

a) Die Maschine arbeitet genau dann noch nach 400 Betriebs- 
stunden, wenn > 400 und X ß > 400 gilt. Da X^ und 

X_ unabhängig sind, hat man nach 2.2.1 
B 

W{X > 400 , X ß > 400) = W(X A > 400) W(X ß > 400) . 

Es gilt 
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und 



W (X > 400) = 1 - W (X < 400) = 1 - <J>(400|350; 50) 
A A — 

= 0,1587 



t.j(v > 400) = 1 - W(X ß < 400) = 1 - $ (400 1 400; 25) 
= 0,5 . 



Damit folgt 

W(X A > 400, X_ > 400) = 0,1587-0,5 = 0,0794 . 

A B 

Mit Wahrscheinlichkeit 0,0794 arbeitet die Maschine noch 
nach 400 Betriebsstunden. 

b) Teil A wird vor Teil B defekt sein, wenn gilt 



oder 



X A - X B < ° • 

Da X A und X ß unabhängige normalverteilte Zufallsvariablen 
sind, ist X A - X R ebenfalls normalverteilt. Wegen 

E (X, - X) = EX- - EX = 350 - 400 = - 50 
A B A B 

var (X A - X ß ) = var X A + var X ß = 50 2 + 25 2 =3125 

ist X. - X n (-50; /3 125) -normalverteilt. Für die Wahr- 
A B 

scheinlichkeit, mit der Teil A vor Teil B ausfällt, 
ergibt sich somit 

W(X - X < 0) = <)> ( 0 ] -50 ; /3T25) = ^ (0,89443) = 0,8145 . 
A B 
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5.5.3 Ein Gerät wird in drei aufeinanderfolgenden, sich 
gegenseitig nicht beeinflussenden Arbeitsgängen hergestellt. 
Die Zeit (in Minuten) , die jeder einzelne Arbeitsgang bean- 
sprucht, ist (7,5; 0,5) -normalverteilt. Mit welcher Wahr- 
scheinlichkeit liegt die Gesamtarbeitszeit für ein Gerät 
zwischen 21 und 22 Minuten? 

Lösung : 

Wir bezeichnen die Dauer des zur Herstellung des Geräts 
notwendigen i-ten Arbeitsgangs mit X i (i = 1, 2, 3) . 

X«| , X 2 und X^ sind nach Voraussetzung unabhängige 

(7,5; 0, 5) -normalverteilte Zufallsvariablen. Daher ist auch 

die Gesamtarbeitszeit 

X = x 1 + x 2 + x 3 

normalverteilt, und wegen 

EX = EX 1 + EX 2 + EX 3 = 3 • 7,5 = 22,5 

var X = var X 1 + var X 2 + var X 3 = 3«0,25 = 0,75 



gilt 



W(X < x) = <J>(x|22,5; /oT75) . 

Die Wahrscheinlichkeit, mit der die Gesamtarbeitszeit für 
ein Gerät zwischen 21 und 22 Minuten liegt, ist dann 

W ( 21 < X < 22) = <> (22(22,5; /Ö7T5) - <#> (21 | 22 ,5; SÖ7T5) 
* 0,2403 . 

24,03 o/o aller Geräte werden also mit einer Arbeitszeit 
zwischen 21 und 22 Minuten hergestellt. 
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5.5.4 Ein echter Würfel wird 2000-mal ausgespielt. 

a) Mit welcher Wahrscheinlichkeit liegt die durchschnitt- 
liche Augenzahl X zwischen 3,4 und 3,6? 

b) Mit welcher Wahrscheinlichkeit ist die relative Häufig- 
keit der Augenzahl 6 größer als 0,16? 

Lösung : 

a) Für die Augenzahl X beim Ausspielen eines echten 
Würfels gilt (vgl. 5.3.2) 

EX = 3,5 , var X = 2,917 . 

Das Mittel X einer Stichprobe vom Umfang 2000 aus der Ver- 
teilung von X ist nach dem Zentralen Grenzwertsatz nähe- 
( 2 917 ' 

rungsweise (3,5 ; y - 2 qqq )~ normalverteilt . Es gilt daher 

W(3,4 < X < 3,6) « <M 3 , 6 | 3 , 5 ; - f^OÖd ] 

- + ( 3,4 | 3,5 ; = 0,9912 . 

b) Die relative Häufigkeit P der Augenzahl 6 bei 2000 

Ausspielungen des Würfels ist näherungsweise normalverteilt 
mit dem Erwartungswert und der Standardabweichung 




\ 2000 " 120 * 

Folglich hat man 

W (P > 0,16) = 1 - W(P < 0,16) 

R* 1 - <K0,16| = 0,7881 . 
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5.5.5* In einer Produktionsserie vom Umfang 10 000 sind 
2000 Teile unbrauchbar. Es werden 100 Teile (ohne Zurück- 
legen) zufällig ausgewählt. 

a) Wie groß ist die Wahrscheinlichkeit, daß 

a^) höchstens 30 
a 2 ) wenigstens 10 

a^) zwischen (einschließlich) 15 und 25 
unbrauchbare Teile in die Auswahl gelangen? 

b) Geben Sie die kleinste ganze Zahl an, die von der Anzahl 
der ausgewählten schlechten Stücke mit einer Wahrschein- 
lichkeit von 0,99 nicht überschritten wird. 

Lösung : 

Die Anzahl X der ausgewählten unbrauchbaren Teile ist 
hypergeometrisch verteilt mit den Parametern n = 100 , 

N = 10 000 und M = 2000 . 

Da mehr als 30 Stücke ausgewählt werden und der Auswahlsatz 
kleiner als 5 % ist, und da der Anteilswert der unbrauch- 
baren Teile in der Produktionsserie zwischen 0,1 und 0,9 
liegt, können wir die Verteilung von X durch die Normal- 
verteilung approximieren 





W(X < 


k) 


w 4>(k + 0 , 5 j 


100*0, 


2 ; / 1 00* 0 , 2 * 0 , 8 ) 








= 4> (k + 0 , 5 | 


20 ; 4 


) , k = 0, 1 , . . . , n . 


Damit 


folgt 










a i> 


W (X < 


30) 


« 4) (30,5 | 20 


; 4) = 


4> (2,625) = 0,9957 


a 2 ) 


W(X > 


10) 


= 1 - W (X < 


9 ) & 


1 - <J> (9 , 5 | 20 ; 4) = 0,9957 


a 3 > 


W(1 5 < 


: X 


< 25) = W (X 


< 25) 


- W(X < 14) 








» <f> (2 5, 5 | 20 ; 


f 4) - 


(1 4 , 5 | 20 ; 4) = 0,8310 . 
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b) c sei die Zahl, für die gilt 



W(X < c) = 0,99 . 

Wir haben 

W(X < c) >« (Mc + 0,5] 20 ; 4) = <M — ■ ? . ' - 5 - 7 20 ) 



Für 



. c+0,5-20 . 
* ( 4 > 

ergibt sich mit der 

c + 0,5 - 20 
4 

und damit 

c = 4 • 2,327 



= 0,99 



Tabelle der 



= 2,327 



- 0,5 + 20 



Standardnormal Verteilung 



28,808 . 



29 ist also die kleinste ganze Zahl, die von der Anzahl der 
ausgewählten schlechten Stücke mit Wahrscheinlichkeit 0,99 
nicht überschritten wird. 



153 




Schätzen 



1. Punktschätzung 

1.1 Problemstellung 

1.1.1 Vielfach interessieren Kennzahlen, die sich nicht 
unmittelbar messen oder berechnen lassen, über die wir aber 
auf Stichprobenbasis Aufschlüsse erhalten können. So ent- 
scheidet z. B. über die Abbauwürdigkeit einer Kohlelager- 
stätte u. a. der Wassergehalt der Kohle, der nur aufgrund 
von Probebohrungen untersucht werden kann. Für Wirtschaft- 
lichkeitsrechnungen ist oft die mittlere Lebensdauer von 
Fahrzeugen, Maschinen oder Verschleißteilen wichtig, wobei 
die Lebensdauer immer nur für einzelne Exemplare ermittelt 
werden kann. 

1.1.2 Im folgenden soll ein Beispiel ausführlicher behan- 
delt werden. Die Stadtwerke einer Großstadt können die 
Glühlampen in den Ampelanlagen in regelmäßigen Abständen 
oder nur bei Defekt erneuern. Im ersten Falle werden bei 
hohem Materialverbrauch Reparaturen weitgehend vermieden, 
so daß die anfallende Arbeit gleichmäßig verteilt und von 
wenigen Beschäftigten bewältigt werden kann. Im zweiten Fal- 
le wird Material gespart, aber die zahlreicheren und unre- 
gelmäßig anfallenden Reparaturen erfordern mehr Beschäftig- 
te, wenn Wartezeiten vermieden werden sollen. Für welche 
der beiden Strategien die zu erwartenden Kosten niedriger 
sind, läßt sich nur ermitteln, wenn die Verteilung F(x) 
der Lebensdauer der verwendeten Glühlampen bekannt ist. 

Da die Brenndauer der nach einem bestimmten Produktions- 
verfahren hergestellten Glühlampen von vielen unabhängig 
voneinander wirksamen Einflußfaktoren bestimmt wird, kann 
man nach dem Zentralen Grenzwertsatz annehmen, daß die 
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Brenndauer eine normalverteilte Zufallsvariable ist. Für 
die Verteilung F (x) der Brenndauer gilt also 

F (x) = 4>(x|u?a) . 

Dabei sind y und o unbekannte Parameter. Da sie sich 
nicht messen lassen, wird man versuchen, aufgrund einer 
Stichprobe ( X ^ , X^ f ..., X^) aus der Verteilung F(x) 
Näherungswerte für y und o zu berechnen. 

1.1.3 Um unser Beispiel zu vereinfachen, nehmen wir an, 
man habe n = 2 und a sei bekannt, etwa o = 100 Stunden. 
Es ist dann nur ein Näherungswert für die unbekannte mitt- 
lere Brenndauer y zu bestimmen. Nach W 3.5.3 hat die 
Stichprobenfunktion 



den Erwartungswert y . Folglich streuen die Realisationen 
von U ^ um y , weshalb es naheliegend ist, das arithme- 
tische Mittel der beiden Meßwerte x^ und x^ als Nähe- 
rungswert für y zu betrachten. Für die Verteilungsfunk- 
tion von U ^ gilt nach W 5.2.2 

F ^ ( x ) = W ( U 1 < x ) = <j> ( x j y ; ) = <!>( 

1.1.4 Statt des arithmetischen Mittels kann man allgemei- 
ner gewogene Durchschnitte der Meßwerte als Näherungswerte 
für y in Betracht ziehen. Geben wir z. B. dem ersten 
Meßwert doppelt soviel Gewicht wie dem zweiten, so ergibt 
sich 



3 

als Näherungswert für y . Da und X^ unabhängige 
normalverteilte Zuf allsvariablen sind, ist nach W 5.2.2 
auch die lineare Funktion 
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normalverteilt. Wegen 

eu 2 = f EX i + i EX 2 = b + b = * 

var U 2 = | var X 1 + 1 var X 2 = |o 2 + jo 2 = | a 2 

gilt für die Verteilungsfunktion von U 2 

F 2 (x) = * ( xju; 10O-^ )=<(.( ). 

/5* 



1.1.5 Schließlich kann man von der Reihenfolge der Messun- 
gen absehen und untersuchen, wie sich z. B. der größere 
bzw. der kleinere Meßwert als Näherungswert für y eignet. 
Wählen wir den größeren der Meßwerte als Näherungswert und 
damit die Stichprobenfunktion 

U 3 = max (X 1 ,X 2 ) 

so ergibt sich als Verteilungsfunktion nach W 2.2.1 (1) 

F 3 (x) = W( X 1 < x, X 2 < x ) = W( X 1 < x ) *W ( X 2 < x ) 

= [*( x [ p ; 1 00 )] 2 = [<*■ ( T5 o ^ 2 - 



1.1.6 Wir differenzieren die Verteilungsfunktionen nach 
der Kettenregel und erhalten so als Dichtefunktionen 
für , U 2 und : 



f 1 (x) 
f 2 (x) 

f 3 (x) 



v 2 
100 



( — — — /2 ) 
V i oo ^ ' 



1 00 ✓ 5 



-2£UL_. 

100/5 



^ i / X \1 v * x-p \ 

ioo ^ ( i oo ' 9 ' Too ^ 
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n der roigenaen Tacene sina werte aer arei uicnterunK 

1 ) 

en für einige Argumente angegeben 



X 


f 1 (x) 


f 2 ( x ) 


f 3 (x) 


y-100 


0,00208 


0,00218 


0,00077 


y- 50 


0,00439 


0,00428 


0,00217 


y 


0,00564 


0,00535 


0,00399 


y + 50 


0,00439 


0,00428 


0,00487 


y + 100 


0,00208 


0,00218 


0,00407 


y + 200 


0,00010 


0,0001 5 


0,00106 



it Hilfe dieser Werte läßt sich der Verlauf der drei D 
efunktionen skizzieren (vgl. Abb . 1). 




) Eine Tabelle der Dichtefunktion der Standardnormalve 
ung findet sich z. B. in: W. WETZEL, M.-D. JÖHNK , P. N 
tatistische Tabellen, S. 95 ff. Berlin: de Gruyter & C 
967. 




1.1.7 Die Abbildung 1 zeigt , daß die Dichten der Stich- 
probenfunktionen U.| und U 2 das Symmetriezentrum y 
besitzen, wobei die Realisationen von stärker um y 

konzentriert sind als die von L 7 2 . Dagegen liegt das Ma- 
ximum der Dichte von rechts von y . Für beliebiges 

c > 0 ist die Wahrscheinlichkeit, mit der die Stichproben- 
funktionen Werte aus dem Intervall [ y-c ; y+c j annehmen, 
für am größten. Deshalb ist von den drei betrachteten 

Möglichkeiten, zu Näherungswerten für die unbekannte mitt- 
lere Brenndauer der Glühlampen zu gelangen, die Berechnung 
des arithmetischen Mittels der beiden Stichprobenwerte of- 
fenbar am günstigsten. 



1.2 Eigenschaften von Schätzfunktionen 

1.2.1 Das im voranstehenden Abschnitt betrachtete Problem 
läßt sich allgemeiner so formulieren: Von einer Zufallsva- 
riablen X mit der Verteilungsfunktion F(x) interessiert 
das unbekannte Moment tt , z. B. der Erwartungswert oder 
die Varianz. Aufgrund einer Stichprobe ( X ^ , ..., X r ) 
aus der Verteilung F(x) soll ein Näherungswert für tt 
ermittelt werden. Als mögliche Näherungswerte werden dabei 
die Realisationen von geeignet zu wählenden Stichproben- 
funktionen 

U = u (X , X , . . . , X ) 

12 n 

angesehen . 

In diesem Falle sagt man, das Moment tt der Zufallsvaria- 
blen X solle aufgrund einer Stichprobe geschätzt werden. 
Die zur Schätzung verwendete Stichprobenfunktion U heißt 
Schätz funkt ion, ihre Realisationen heißen Schätzwerte für tt 



1.2.2 In 1.1 haben wir von drei in Betracht gezogenen 
Stichprobenfunktionen diejenige als Schätzfunktion für tt 
wählen können, die die Wahrscheinlichkeit 
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W( j U - TT | < c ) 



( 1 ) 



für alle c > 0 maximiert. Nun wollen wir als mögliche 
Schätzfunktionen für tt alle Stichprobenfunktionen zulas- 
sen. Es läßt sich dann keine Stichprobenfunktion U mehr 
finden, die die Wahrscheinlichkeit (1) für alle c > 0 
maximiert. Wir wollen aber zeigen, daß die Wahrscheinlich- 
keit (1) jedenfalls für solche Stichprobenfunktionen 

2 

groß ist, für die E ( U - tt ) klein ist. Dazu verallge- 
meinern wir die Ungleichung von BIENAYMfi-TSCHEBYSCHEFF . 
Analog zu W 3.3.7 gilt 

0 *W [(U-TT ) 2 <c 2 ]+ c 2 • W [(U-tt) 2 > c 2 j < E (U-tt) 2 
und damit 



W ; (U-tt) ‘ 



E (U-tt) ‘ 



Wegen 



W ( | U-TT | < C ) = 1 - W ( | U-TT | > c ) 



erhalten wir damit die Ungleichung 



W ( | U-tt | < c ) > 



E (U-tt) 2 
2 



W[ (U-tt) 2 > C 2 ] 



( 2 ) 



(die für tt = EU in die Ungleichung von BIENAYM£-TSCHEBY- 
SCHEFF übergeht, vergl. W 3.3.7). Also sind die Schätzwer- 
te jedenfalls dann mit hoher Wahrscheinlichkeit um das zu 

schätzende Moment tt konzentriert, wenn die quadratische 
2 

Streuung E ( U - tt ) der Schätzfunktion um tt klein ist 
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1.2.3 Für eine Schätzfunktion U für tt heißt EU - tt 
der systematische Fehler oder die Verzerrung von U . Die 
quadratische Streuung von U um das zu schätzende Moment 
läßt sich zerlegen in die Varianz und das Quadrat der Ver- 
zerrung 

E(U-tt ) 2 = E [(U-EU) + (EU-t t ) ] 2 

= E (U-EU) 2 + 2 (EU-tt) *E (U-EU) + (EU-tt ) 2 
= var U + (EU-tt ) 2 . 

Eine Schätzfunktion U mit 
EU = TT 

heißt unverzerrte oder erwartungstreue Schätzfunktion für tt 
Wie Abb. 1 zeigt, sind in dem eingangs betrachteten Beispiel 
U^ und U 2 unverzerrte Schätzfunktionen für p , während 
U^ verzerrt ist. Nach W 3.5.3 ist das Stichprobenmittel X 
ganz allgemein unverzerrte Schätzfunktion für p = EX . 

Ebenso ist nach W 3.5.4 die Stichprobenvarianz unverzerrte 
2 

Schätzfunktion für o = var X . 

Die Aufspaltung der Streuung der Schätzfunktion um tt zeigt 
daß die Schätzwerte von unverzerrten Schätzfunktionen dann 
mit möglichst hoher Wahrscheinlichkeit bei tt liegen, wenn 
die Varianz der Schätzfunktion möglichst klein ist. Eine er- 
wartungstreue Schätzfunktion für tt mit minimaler Varianz 
heißt effiziente Schätzfunktion für tt . Man kann mit eini- 
gem Aufwand zeigen, daß X für eine normalverteilte Zufalls 
variable X effiziente Schätzfunktion von p = EX ist 

1.2.4 Da die Kosten für eine Stichprobenerhebung mit dem 
Stichprobenumfang zunehmen, lohnen sich große Stichproben 
nur, wenn die Genauigkeit der Schätzwerte mit dem Stichpro- 
benumfang steigt. Man wird also für wünschenswert halten, 
daß die Wahrscheinlichkeit, mit der die Schätzwerte nahe bei 

1) Vgl. HOGG/CRAIG (1971), S. 253 ff. 
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dem wirklichen Parameterwert liegen, mit wachsendem Stich- 
probenumfang gegen 1 strebt. 

Sei U eine Schätzfunktion für das Moment tt , wobei durch 
n 

n der Stichprobenumfang gekennzeichnet werden soll. 

heißt konsistente S ohät zfunktion für tt , wenn U für 

J n 

n-K» stochastisch gegen tt konvergiert, d. h. wenn für 
beliebiges c>0 gilt 

lim W ( ! U -tt | <c ) = 1 . 

n ' = 



Nach 1.2.2 und 1.2.3 ist eine Schätz funktion U jedenfalls 

n J 

dann konsistent, wenn gilt 

lim EU = tt und lim var U = 0 . 
n n 

n -*oo n-*°° 

Insbesondere sind unverzerrte Schätz funktionen jedenfalls 
konsistent, wenn die Varianz mit n-*°° gegen 0 strebt. X 
ist also konsistente Schätz funktion für EX f was bereits 
als "Gesetz der großen Zahlen" in W 3.5.5 bewiesen wurde. 



1.3 Schätzung von Erwartungswerten 

1.3.1 In 1.2.3 wurde erwähnt, daß für eine normalverteilte 
Zufallsvariable X das Stichprobenmittel effiziente Schätz- 
funktion für EX ist. Ohne die Voraussetzung, daß X nor- 
malverteilt ist, ist diese Aussage falsch, wie im folgenden 
an einem Beispiel gezeigt werden soll. 

Die Zufalls variable X sei gleichverteilt im Intervall [o,a], 

d. h. 



f (x) 



( 1 



l 0 



für 0 < x < a 
sonst 
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sei die Dichte und 



f 0 


für 


x < 0 


II 



pj 1 X 


für 


0 < x < a 


V 1 


für 


a < x 



die Verteilungsfunktion von X . 

( , X 2 , . .., X n ) sei eine Stichprobe aus der Verteilung 
F(x) . Dann ist 

X = - (X, + X 0 + ... + X ) 
n 1 2 n 

eine erwartungstreue Schätzfunktion für den Erwartungswert 
a 2 



EX = / |dx = ^ | a - f 



Für die Varianz von X gilt 



var X = / (x— f ) 1 — dx = / [ — - x + ^ ] dx 

o a o a 



3 2 2 

x _ x_ _l ax I a = 

3a 2 4 ’O ~ 12 



Damit folgt für die Varianz von X 



var X 



1 „ 1 a 

I var X . = — var X = -t-k— 

2 in 12n 



n 



1.3.2 Wir betrachten nun die Zufallsvariable U , deren 
Realisation gleich dem jeweils größten Stichprobenwert sei 

U = max (X 1 , X 2 , . . . , X n ) . 

U ist genau dann < x , wenn alle Stichprobenwerte < x 
sind. Daher gilt für die Verteilungsfunktion von U 
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G (x) = W(U < x) = W(X, < x, X_ < x, X < x) 

= i = 2 = n = 

= W(X, < x) ••• W(X < x) = F n (x) 

1 = n = 



f 0 für x < a 



für O < x < a 



^ 1 für a < x 



und für die Dichte von U 



f — x n 1 für O < x < a 



g (x) = as G(x > = a 



Damit folgt für den Erwartungswert 

a . a n+1 

„ TT r n n-1, n r n, n x a 

EU = f x*— x dx = — j x dx = — n 

~ n n _ n n+ 1 1 0 

0 a a O a 



Folglich ist 



u* = 2±I U 

2n 



eine erwartungstreue Schätzfunktion für — = EX . Wegen 



~ a n . a , . n+2 

_ T1 2 , 2 n n-1, n , n+1, n x ,a 

EU = j K x dx = — j x dx = — ! 0 

0 a a O a 



n a 2 

n+2 



ergibt sich für die Varianz von U* 
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var U* 



( TT )2 var U = ( T5T )2 [ Eü2 



- (EU) 2 ] 



= ( 



n+1 

2n 



r n 

n+2 



2 



a 

4n (n+2 ) 



n 

n+1 



2 ! 
a 



1.3.3 Werden die Schätzfunktionen X und U* aus Stichpro- 
ben vom Umfang n berechnet, so gilt 

var U* = 3 

- n+2 

var X 

Für n = 1 ist U* = X , während U* für n>1 eine erwar- 
tungstreue Schätzfunktion für EX ist, deren Varianz um den 

Faktor — kleiner ist als die Varianz von X . Damit kann 
n+2 

X für n>1 keine effiziente Schätzfunktion für EX sein. 
Wir zeigen aber anschließend, daß X effiziente "lineare" 
Schätzfunktion für EX ist. 



1.3.4 Ist X eine Zufallsvariable mit der Verteilungs- 
funktion F(x) und ist (X^ , X^) eine Stichprobe 

aus der Verteilung F(x) , so nennen wir jede Schätz funktion 

U=u ' X 1' X 2 V - c o + C 1 X 1 + ••• + c n X n 

mit beliebigen reellen Koeffizienten c q , c^ , ..., c^ eine 
lineare Schätz funktion für EX . Offenbar ist X die linea- 
re Schätz funktion mit 

c =0 und c„ = ... = c = — 
o 1 n n 

1.3.5 Für den Erwartungswert einer linearen Schätzfunktion 
gilt 



E(c o+Cl X 1 + ... + C n X n ) - C o+Cl EX 1 + ... + C n EX n 

= c + (c^ + c n + . . . + c ) EX . 
o 1 2 n 
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Für beliebige Werte von EX ist eine lineare Schätz funktion 
für EX also genau dann erwartungstreu, wenn gilt 

n 

c =0 und Ec. = 1 
° i 1 

1.3.6 Da die Zufallsvariablen X^ unabhängig sind, erhal- 
ten wir für die Varianz einer erwartungstreuen linearen 
Schätz funktion 

n n 2 n 2 

var Z c.X. = Z c. var X. = var X Z c. 

i 1 1 i 1 1 i 1 

mit Z c. = 1 . Die Varianz wird also am kleinsten, wenn 

i 

die c. unter der Nebenbedingung Z c. = 1 so gewählt wer- 

1 2 1 
den. daß Ec. minimal ist. 

f l 

Da für das arithmetische Mittel c der Koeffizienten c^ 
gilt 



I (c - c) 2 



c 

1 



-2 

nc 



folgt wegen c 



2 

n 



Z 



b 2 



c 

l 



2 

n 



und daraus 



2 
c 

i 



z (C ± 



y 



+ 



2 

n 



Die rechte Seite wird am kleinsten für 



Also minimiert diese Wahl der die Varianz. Damit ist 

X die lineare unverzerrte Schätzfunktion für EX mit der 
kleinsten Varianz, d. h. X ist effiziente lineare Schätz- 
funktion für EX . 
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Da man in der Literatur Schätzfunktionen minimaler Varianz 
auch als "beste" Schätzfunktionen bezeichnet, nennt man X 
oft auch beste lineare unverzerrte Schätzfunktion - oder 
kurz BLJJ-Sehätzung - für EX. 

1.3.7 Unsere Überlegungen gelten sinngemäß auch für das 
Schätzen von Wahrscheinlichkeiten. 

Sei A ein Ereignis, dessen Wahrscheinlichkeit 6 geschätzt 
werden soll. Wird das zugrundeliegende Zufallsexperiment 
n-mal wiederholt und tritt dabei X-mal das interessierende 
Ereignis A auf, so ist es aufgrund der Häufigkeitsinterpre- 
tation der Wahrscheinlichkeit (vergl. W 1.4.1) naheliegend, 
die relative Häufigkeit mit der A beobachtet wird, als 
Näherungswert für 6 zu betrachten. Wir wollen zeigen, daß 
dieses Vorgehen zweckmäßig ist. 

Ist Q die Ergebnismenge des zugrundeliegenden Zufallsex- 
periments, so ist die Indikatorvariable X^ definiert durch 

für e e A 

für e l A 



f 1 



x A (e) = 



Wegen 



W(X A = 1 ) = W(A) = e 

ist X A BERN OULLI- verteilt mit Parameter 0 . 

Ist (X^ , X 2 , ..., X n ) eine Stichprobe aus der BERN OULLI - 
Verteilung mit Parameter 0 , so heißt 



nach W 4.1.4 Stichprobenanteilswert und es gilt 
EP ’= 0 



Nach dem über das Stichprobenmittel Bewiesenen ist P also 
effiziente lineare Schätzfunktion für die unbekannte Wahr- 
scheinlichkeit 0 . 
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1.3.8 Soll z. B. die Wahrscheinlichkeit geschätzt werden, 
mit der beim Werfen eines bestimmten Würfels die Sechs er- 
scheint, so spielt man den Würfel n-mal aus. Sind 
X 1 , X 2 , ..., X n die durch 

( 1 falls die i-te Ausspielung eine Sechs ergibt 

X . = 

'v 0 sonst 

definierten Zuf allsvariablen , so ist (X^ , X^, . X^) eine 

Stichprobe. I X. ist die Anzahl und 



n 

der Anteil der Ausspielungen, die eine Sechs ergeben. P ist 
effiziente lineare Schätzfunktion für die Wahrscheinlichkeit, 
mit der die Sechs beim Ausspielen des Würfels auftritt. 



1 .4 Schätzung von Varianz und Kovarianz 

1.4.1 Häufig muß außer dem Erwartungswert auch die Varianz 
einer Zufallsvariablen geschätzt werden. Sei X eine Zu- 
fallsvariable mit der Verteilungsfunktion F(x) . Wir setzen 

2 

o = var X . 

In W 3.5.4 wurde gezeigt, daß für eine Stichprobe 
(X.J, x 2 , ..., X n ) aus der Verteilung F(x) die Stichproben- 

funktion 

o 1 - 2 

S^ = -Ar Z (X. - X) Z 
n- 1 i 

2 

eine erwartungstreue Schätzfunktion für o ist, während 

1 - 2 

die Stichprobenfunktion — I (X^ - X) nicht erwartungs- 
treu ist. Von beiden Zuf allsvariablen läßt sich aber zeigen, 

2 

daß sie konsistente Schätz funktionen für o sind (vgl. 

W 3.6.3) . 
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1.4.2 In vielen Fällen soll nicht die Varianz, sondern die 
Standardabweichung o geschätzt werden. Es liegt nahe, da- 
zu die Stichprobenfunktion 



s =V^ z (x i - x)2 

zu verwenden. S ist jedoch keine erwartungs treue Schätz- 
funktion für a . Denn aus 

0 < var S = ES 2 - (ES) 2 



folgt 



2 2 2 
(ES) < ES = a 

und damit 

ES < g . 

Die Schätzfunktion S unterschätzt im Mittel die Standard- 
abweichung. 

1.4.3 Werden zwei Zufallsvariablen X und Y gleichzei- 
tig betrachtet, so interessiert auch die Kovarianz der bei- 
den Zuf allsvariablen . Sind (X^ , , ..., X ) und 

(Y^ , Y 2 , ..., Y n ) verbundene Stichproben aus den Verteilun- 
gen von X und Y , so läßt sich zeigen, daß die Stichpro- 
benkovarianz 

1 n 

-- -r l (X. - X) (Y. - Y) 
n-1 ^ l l ' 

erwartungstreue und konsistente Schätzfunktion für cov (X,Y) 
ist, während 

1 n 

- I (X. - X) (Y. - Y) 

n 1 i i 

nur konsistente Schätzfunktion für cov (X,Y) ist (vgl. W 3.6.5). 
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2. Intervallschätzung 



2.1 Problemstellung 

2.1.1 Bei Durchführung einer Punktschätzung wird man fast 
immer zu einem Schätzwert gelangen, der von dem zu schätzen- 
den Moment verschieden ist. Da das Ausmaß der Abweichung un- 
bekannt ist, interessiert man sich zusätzlich für Grenzen, 
die den fraglichen Wert praktisch sicher einschließen. Die 
Angabe solcher Grenzen für das zu schätzende Moment nennt 
man Intervallschätzung . 

2.1.2 Zu solchen Intervallgrenzen gelangt man für erwar- 
tungstreue Schätzfunktionen in einfacher Weise, wenn man 
die Ungleichung von BIENAYMfi-TSCHEBYSCHEFF zum Ausgangs- 
punkt nimmt. Ist U eine erwartungstreue Schätzfunktion 
für tt und setzen wir 

2 

g = var U 
u 

so läßt sich die Ungleichung von BIENAYMfj-TSCHEBYSCHEFF nach 
W 3.3.7 (3) in folgender Form schreiben: Für beliebiges 
t > 0 gilt 

W ( TT — 1 0 <U< TT + tG ) > 1 - -Xr 

u = u' 2 

Die Schätzfunktion U nimmt also Werte aus dem Intervall 

[ TT - tö ; TT + tö 1 
L U U J 
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2 

mit einer Wahrscheinlichkeit an, die größer ist als 1-1/t 
Im folgenden wollen wir zeigen, daß das "Ersetzen" von tt 
durch die Schätzfunktion U zu einem Intervall mit zufalls- 
abhängigen Grenzen führt, das tt mit derselben Wahrschein- 
lichkeit überdeckt, mit der U Werte aus dem Ausgangsinter- 
vall annimmt. 

2.1.3 Für eine Realisation von U sind die beiden Doppel- 
ungleichungen 

tt - ta <u<tt + ta 
u = u 

u-ta <7T<u+ta 
u = u 

äquivalent, denn jede besagt, daß sich u und tt dem Be- 
trage nach um höchstens t unterscheiden (vgl. Abb. 2). 



Abb 




Folglich tritt das Ereignis 

{ tt - ta < U < tt + ta } 

1 u = u J 

genau dann ein, wenn das "Zufallsintervall" 

[u - ta ; U + ta 1 
L u u J 

den Parameter tt überdeckt. Deshalb gilt 

W( n e [U - ta u ; U + to u ] ) = W ( tt - ta u < U < 11 + ta u ) • 

2.1.4 Wie die Ungleichung von BIENAYMfi-TSCHEBYSCHEFF für 

t = /TO = 3,162 , d. h. 1 \ = 0,9 

t 
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zeigt, nimmt die Schätzfunktion U mit über 90 % Wahrschein 
lichkeit Werte aus dem Intervall 

£ tt - 3,162a^ ; ir + 3,162a^J 

an. Aus 2.1.3 folgt dann, daß das Intervall 

f U - 3 , 162a ; U + 3 , 162a 1 

den unbekannten Erwartungswert tt mit einer Wahrscheinlich 
keit von ebenfalls über 90 % überdeckt. Realisationen die- 
ses Intervalls lassen sich aus Stichprobendaten berechnen, 

wenn a bekannt ist. Andernfalls muß a durch eine obe- 
u u 

re Schranke ersetzt werden. 



2.2 Eigenschaften von Konfidenzintervallen 

2.2.1 Leider sind die oben abgeleiteten Intervalle in den 
praktisch wichtigen Fällen so lang, daß die Aussage oft 
trivial wird. Zu besseren Ergebnissen gelangt man, wenn die 
Verteilung der Schätz funktion U bekannt ist und die Wahr- 
scheinlichkeit für das Ereignis 

{7T-C<U<7T + c} 

nicht mit der Ungleichung von BIENAYMfi-TSCHEBYSCHEFF abge- 
schätzt werden muß, sondern berechnet werden kann. Man er- 
hält dann Intervalle, die den Parameter genau mit der vorge 
gebenen Wahrscheinlichkeit überdecken. 

2.2.2 Ein Intervall, dessen Grenzen aus Stichprobendaten 
berechnet werden können, und das das unbekannte Moment mit 
einer vorgegebenen Wahrscheinlichkeit überdeckt, nennt man 

Konfidenzintervall oder Vertrauensintervall für das interes 
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sierende Moment. Die vorgegebene Wahrscheinlichkeit heißt 
Konfidenzzahl oder Sicherheitsgrad und wird gewöhnlich mit 
1 - a bezeichnet. Die gebräuchlichsten Konf idenzzahlen 
sind 0,95 und 0,99 . 

Ein Konfidenzintervall I ist also ein Intervall, dessen 
Grenzen Stichprobenfunktionen sind 

I = L u-| (X^ , X 2 1 • • • t X n ) ; u 2 ^1 ' ^2 r J • 

Die Realisationen dieses "Zufallsintervalls" überdecken 
das unbekannte Moment oder auch nicht. Die Zufallsvariablen 
U.j und U 2 sind aber so gewählt, daß gilt 

W(tt e [u i ,U 2 ] ) = 1 - a . 

Werden also Realisationen eines Konfidenzintervalls zur Kon- 
fidenzzahl 1 - a für eine große Zahl von Stichproben be- 
rechnet, so wird man Intervalle erhalten, deren Lage und 
Länge i. a. variieren. Aber die relative Häufigkeit für das 
Überdecken von tt wird ungefähr bei der vorgegebenen Konfi- 
denzzahl 1 - a liegen. 



In Abb. 3 sind 25 Intervalle nebeneinander gezeichnet, wie 
sie sich als Realisationen eines Konfidenzintervalls zur 
Konfidenzzahl 0,9 aus 25 verschiedenen Stichproben erge- 
ben haben könnten. Ungefähr 10 % (3 von 25) der Realisatio- 

nen überdecken das zu schätzende Moment tt nicht. 



fMtMtt 



0 

Abb. 3 



J — 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 , 

5 10 15 20 25 

Nummer der Stichprobe 
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2.3.3 Die Konstruktion von Konfidenzintervallen bei bekann- 
ter Verteilung der Schätzfunktion U verläuft analog zu den 
Überlegungen oben: Man bestimmt ein Intervall um tt , so daß 
U Werte aus dem Intervall mit der Wahrscheinlichkeit 1 - a 
annimmt. Dieses Intervall wird gemäß 2.1.3 in ein "Zufalls- 
intervall" transformiert, das tt mit derselben Wahrschein- 
lichkeit 1 - ot überdeckt. 

Für die Wahl des Ausgangs intervalls gibt es im Prinzip viele 
Möglichkeiten. Ob die Entscheidung für ein um tt symmetrisch 
gelegenes Intervall 

[tt-c; tt + c] 

zweckmäßig ist, hängt von der Verteilung von U ab. Man wird 
es als wünschenswerte Eigenschaft von Konfidenzintervallen 
ansehen, daß die Überdeckungswahrscheinlichkeit für jede von 
tt verschiedene Zahl möglichst klein ist. Deshalb wird man 
versuchen, die Länge des Ausgangsintervalls zu minimieren. 

Ist U erwartungstreue Schätzfunktion für tt und hat U 
eine symmetrische eingipflige Verteilung - etwa eine Nor- 
malverteilung oder eine STUDENT-t-Verteilung - so ist ein 
Intervall, dessen Werte U mit der Wahrscheinlichkeit 1 - a 
annimmt, am kleinsten, wenn es symmetrisch um tt liegt 
(vgl . Abb . 4 ) . 




In diesen Fällen ist es sicher zweckmäßig, von einem zu tt 
symmetrischen Intervall auszugehen. 
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2.2.4 Von den betrachteten Schätzfunktionen haben wir Ver- 
teilungsaussagen im wesentlichen nur für das Stichproben- 
mittel kennengelernt. Deshalb wollen wir uns im folgenden 
auf die Konstruktion von Konfidenzintervallen für Erwartungs- 
werte beschränken. Im übrigen werden wir nicht nur das " Zu- 
fallsintervall" , sondern auch seine Realisationen Konfidenz- 
intervalle nennen, wobei sich die jeweilige Bedeutung aus 
dem Zusammenhang von selbst ergibt. 



2.3 Konfidenzintervalle für Erwartungswerte 



2.3.1 Der Erwartungswert y einer (y,a) -normalverteilten 
Zufallsvariablen X sei unbekannt. Für eine Stichprobe 
(*i , X , X ) aus der Verteilung von X ist das Stich- 

probenmittel 



nach W 5.2.2 eine (y,— — ) -normalverteilte Zufallsvariable. 

/"n 

Nach W 5.1.6 gilt dann für jedes a mit 0 < a < 1 



W (y-z 



a/ 2 



a 

/n “ 



5 = U+Z a/2 




a . 



(Vgl. Abb. 5.) 
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Für das "Zufallsintervall 



! X - z 



0/2 /n 



X + z /0 -2- 

/ — -* 



"a/2 






M) 



folgt dann mit der Überlegung in 2.1.3 



W(y 



r- 



J a/2 



g 

vn 



X + 



" a/2 



jz_i 

/n j 



a 



Da die z a /2 ” Werte tabelliert vorliegen, lassen sich die 
Realisationen von (1) bei bekanntem a aus Stichproben- 
daten berechnen. In diesem Falle ist (1) also Konfidenz- 
intervall zur Konf idenzzahl 1 - a für den unbekannten 
Erwartungswert y . 



Da z /n mit der Konf idenzzahl wächst, erhöht sich die 
a/2 ’ 

Länge 



des Intervalls mit der Konf idenzzahl . Je größer also die 
angestrebte Sicherheit, um so ungenauer die Aussage über den 
unbekannten Erwartungswert. Jedoch läßt sich die Schärfe der 
Aussage bei vorgegebenem Sicherheitsgrad durch Vergrößerung 
des Stichprobenumfangs erhöhen. Z. B. verkürzt eine Vervier- 
fachung des Stichprobenumfangs die Länge des Konfidenzinter- 
valls auf die Hälfte. 



2.3.2* Wir wollen noch zeigen, daß vom Konfidenzintervall 
(1) keine Zahl mit größerer Wahrscheinlichkeit überdeckt 
wird als y . Für eine beliebige Zahl x gilt nach den Über- 
legungen von 2.1.3 



x e ; X - z 



°/ 2 /n 



X + z 



a / 2 /n J 



genau dann, wenn 



x 



a/2 



a 

/n 



< X < x + z /n 
= = a/2 



o 

/n 
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erfüllt ist. Daher folgt 




Die Wahrscheinlichkeit, mit der x überdeckt wird, ist also 
gleich dem Inhalt des in Abb. 6 schraffierten Flächenstücks 
der Breite 2z a /2 unter der Standardnormalverteilung. Für 
x -> -» und x +°° wird der Flächeninhalt Null. Am größten 
ist er offenbar für (x-y) — = 0 , d. h. für 

x = y 



2.3.3 Im allgemeinen wird o unbekannt sein, so daß (1) 
aus Stichprobenwerten nicht berechnet werden kann. Nach 
W 5.2.4 ist die Zuf allsvariable 






mit S = i|—L i (X. - X) 2 

V n_1 i 1 



STUDENT-t-verteilt mit n - 1 Freiheitsgraden, und es gilt 
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w(-t 



n- 1 , a/2 



— — - — — /n < t 1 /0 ) = 1 - a 

S = n-1 , a/2 



für alle O < a < 1 . Daraus folgt 

W(-t . .. — < X - p < t . ,, — ) = 1 - 

n-1 ,cx/2 y- = = n-1 ,a/2 ^ 



oder 



W(y 



fc n- 1 , a/2 




X < U + t . -4;) 

n 1 , a / 2 / 

v' n 



a 



Mit denselben Überlegungen wie in 2.1.3 ergibt sich dann 



X - t 



n- 1 , a/2 



/n 



X + t , /0 — ! 

n-1, a/2 v/ - J 



( 2 ) 



als Konfidenzintervall zur Konf idenzzahl 1 - a für den 
Erwartungswert einer normalverteilten Zufallsvariablen . 

Im Unterschied zum Konfidenzintervall (1) , bei dem die 

Länge konstant war, variiert beim Konfidenzintervall (2) 
sowohl die Lage als auch die Länge. Nach 1.4.2 wird a 
durch S im Durchschnitt unterschätzt. Das wird durch die 
im Vergleich zu den z-Werten größeren t-Werte ausgeglichen. 

2.3.4 In vielen praktisch wichtigen Fällen wird man nicht 
voraussetzen können, daß die Zufallsvariable X , deren 
Erwartungswert geschätzt werden soll, normalverteilt ist. 
Konfidenzintervalle für y müssen dann mit Hilfe des Zen- 
tralen Grenzwertsatzes konstruiert werden. Nach W 5.3.6 ist 
für große Stichproben aus einer beliebigen Verteilung die 
Zufalls variable 



X - y 
S 



/n 



annähernd standardnormalverteilt, d. h. es gilt 
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W(_Z a/2 ± 2L i^ = Z a/2 ) = 1 “ “ * 



Nach Überlegungen wie in 2.3.3 ist dann 

[ X - z /0 — ; X + z /0 — | 

1 a/2 /iT a/2 /n J 



( 3 ) 



Konfidenzintervall zur Konf idenzzahl 1 - a für den Er- 
wartungswert einer beliebig verteilten Zufallsvariablen X. 

Da sich nach W 5.2.4 die STUDENT- t-Verteilungen mit minde- 
stens 30 Freiheitsgraden kaum von der Standardnormalvertei- 
lung unterscheiden, stimmen die Konfidenzintervalle (2) 
und (3) für große Stichproben überein. 

2.3.5 Mit Hilfe des Zentralen Grenzwertsatzes lassen sich 
auch Konfidenzintervalle für unbekannte Wahrscheinlichkei- 
ten konstruieren. In 1.3.7 haben wir die Wahrscheinlichkeit 
6 eines interessierenden Ereignisses A durch den Stich- 
probenanteilswert P geschätzt. Nach W 5.3.7 ist die Zu- 
fallsvariable 



P - 6 

P(1-P) 

n 



für großes n annähernd standardnormalverteilt. Dann folgt 
wie in 2.3.4, daß 



P - z 



ot/2 






p(i-p) 
n 



P + z 



../ Pd-TT 

a/2 1/ n 



(4) 



Konfidenzintervall zur Konf idenzzahl 1 - a für die zu 
schätzende Wahrscheinlichkeit 0 ist. Dabei ist - wie in 
W 5.3.7 vereinbart - die Approximation durch die Normalver- 
teilung zulässig für n > 50 . 
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2.4 Notwendiger Stichprobenumfang bei 
vorgegebenem Fehler 

2.4.1 Da die Kosten empirischer Erhebungen in der Regel 
proportional zum Stichprobenumfang steigen, wird man vor 
Beginn einer Untersuchung überlegen, bei welchem Stichpro- 
benumfang die angestrebte Genauigkeit gerade erreicht wird. 
Wie wir gesehen haben, beträgt mit Wahrscheinlichkeit 
1 - a die absolute Abweichung des Stichprobenmittels 
vom Erwartungswert für eine normalverteilte Zufallsvariable 
höchstens 

t -S- 

n-'lfCi / 2 

und für eine beliebig verteilte Zufallsvariable bei n > 50 
höchstens 




Soll der absolute Fehler eine vorgegebene Größe e nicht 
überschreiten und ist s eine aus theoretischen Überlegun- 
gen oder aus der Erfahrung abgeleitete obere Schranke für 
die Stichprobenstandardabweichung, so ergibt sich aus 



n_1 ' a/2 /n 



bzw. 



"a/2 



s 

— < e 
/n 



für den notwendigen Stichprobenumfang 



ft « 
i n-1 ,a 



/ 2 



bzw. n > 



z /0 s 



Sollen sich also mit einer Wahrscheinlichkeit von mindestens 
1 - a das Stichprobenmittel X und der zu schätzende Er- 
wartungswert y absolut um höchstens e unterscheiden, so 
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ist für n die kleinste ganze Zahl zu wählen, die 



n > max 



Z g/2 5 



2 



50 



erfüllt. Stammt die Stichprobe aus einer Normalverteilung, 
so genügt als Stichprobenumfang schon die kleinste ganze 
Zahl n mit 



^n-1 ,a/2 S 



2.4.2 Soll eine Wahrscheinlichkeit bis auf einen absoluten 
Fehler von e durch den Stichprobenanteilswert P ge- 
schätzt werden, so muß nach 2.3.5 gelten 



"a/2 Y „ 



-P) 



z /9 \ 2 

-*£■) - p ( i - 



(1-P) 



d.h. 



Nun läßt sich für die Zufallsvariable P(1-P) sehr einfach 
eine obere Schranke ableiten. Nach W 4.1.5 gilt nämlich 

p(i-p) < i 

und wir erhalten als untere Schranke für den Stichproben- 
umfang 



n > 



Z «/2 \ 2 l 
e ) 4 



z g/2 

2e 



2 



Beim Sicherheitsgrad 1 - a schätzt der Stichprobenanteil 
die unbekannte Wahrscheinlichkeit also mit einem absoluten 
Fehler von höchstens e , wenn für n gilt 
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( z -^) 

\ 2e J 



2.4.3 Soll z. B. eine Wahrscheinlichkeit beim Sicherheits- 
grad 0,9544 bis auf 0,01 genau geschätzt werden, so er- 
halten wir für den Stichprobenumfang 



n > 



/ 2 

\. 2 - 0,01 



2 



100 2 = 10 000 . 



Begnügt man sich dagegen mit dem doppelten maximalen Fehler 
von 0,02 , so folgt für n 



* 0,02 ) 



= 50 



2 500 . 



Die halbe Genauigkeit ist also mit einem Viertel des Stich- 
probenumfangs zu erreichen. 

Es könnte der Eindruck entstehen, daß die beträchtliche 
Höhe der errechneten Mindeststichprobenumfänge auf eine zu 
grobe Abschätzung von P(1-P) zurückzuführen ist. Es gilt 
aber beispielsweise für 0,3 < p < 0,7 



0,21 < p ( 1 -p) <0,25 . 



Selbst wenn man also bei einem bestimmten Zufallsexperiment 
sicher sein könnte, daß der Stichprobenanteilswert 0,3 
nicht übersteigt, ergäbe sich bei einem Sicherheitsgrad von 
0,9544 und einem maximalen absoluten Fehler von 0,01 we- 
gen 



n 1 



_ 2 _\ 2 

0,01 J 



0,21 



8 400 



noch ein Mindeststichprobenumfang von 8 400 . 
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3. Aufgaben 



3.1 Man weiß aus Erfahrung, daß die Dicke der von einer 
bestimmten Maschine gefertigten Plättchen normalverteilt 
ist. Um die mittlere Dicke y der Plättchen zu schätzen, 
werden 10 Plättchen gefertigt; man mißt ihre Dicke und er- 
hält (in mm) 

3,18; 3,01; 3,16; 3,00; 3,23; 3,08; 2,95; 3,11; 3,21; 3,07. 

Berechnen Sie aufgrund dieser Stichprobe für den unbekannten 
Mittelwert y Konfidenzintervalle zu den Konf idenzzahlen 
95 % und 99 %. 

Lösung : 

Da es sich bei den erhaltenen Daten um die Realisation 
einer Stichprobe aus einer Normalverteilung handelt, ist 
das Intervall 



[ 



X 



fc n-1 ;a/2 



S 

/n 



X + t 



n-1 ;o/2 



S 

✓n . 



ein Konfidenzintervall zur Konf idenzzahl 1 - a für den 
unbekannten Mittelwert y . 

Wir berechnen zunächst aus den Stichprobendaten die Realisa- 
2 

tionen von X und S . Dazu benutzen wir die folgende 
Hilfstabelle 
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X . 
1 


x. -x 

l 


(x i -x) 


3,18 


+0,08 


0,006 4 


3,01 


-0,09 


| 0,0081 


3,16 


+0,06 


0,0036 


3,00 


-0,10 


0,0100 


3,23 


+0,13 


0,0169 


3,08 


-0,02 


0,0004 


2,95 


-0,15 


0,0225 


3,11 


+0,01 | 


0 , 000 1 


3,21 


+0,11 


j 0,0121 


3,07 


-0,03 


0,0009 


31,00 




0,0810 



Es ergibt sich 



5 = K E x i = lV 31 ' 0 = 3 ' 10 



s 2 = £ (x ± -x) 2 = 1-0,081 = 0,009 



— = v'0 , 0009 = 0,03 . 

/n 



Aus den Stichprobenwerten folgt also als Konfidenzintervall 
zur Konfidenzzahl 1 - a für die mittlere Dicke der Plätt- 
chen das Intervall 

[ 3(1 ~ fc 9,ct/2 0,03 1 3 ' 1 + t 9, a /2 0 ' 03 

Für die Konfidenzzahl 1 - a = 0,95 , d. h. a/2 = 0,025 , 
entnimmt man der Tabelle der STUDENT- t-Vertei lungen im 
Schnittpunkt der Zeile für k = 9 Freiheitsgrade und der 
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Spalte für a = 0,025 den t-Wert 



t 9;o,o25 



2,262 . 



Dann erhält man für die Grenzen des gesuchten Konfidenz- 
intervalls 



3,1 - 2,262-0,03 = 3,03214 
3,1 + 2,262-0,03 = 3,16786 . 

Das Intervall 

[ 3,03214 ; 3,16786 ] 

ist also ein Konfidenzintervall zur Konf idenzzahl 95 % 
für die mittlere Dicke der Plättchen. 

Für die Konfidenzzahl 1 - a = 0,99 , d. h. a/2 = 0,005, 
entnimmt man der Tabelle der STUDENT-t-Verteilungen den Wert 



fc 9 ; o , oo5 



3,25 . 



Daher ist 



[3,0025 ; 3,1975 ] 



ein Konfidenzintervall zur Konfidenzzahl 99 % für den unbe- 
kannten Mittelwert y. 

Man sieht: Mit der Vergrößerung der Sicherheit schwindet 
die Genauigkeit der Aussage über die unbekannte mittlere 
Dicke der Plättchen; das Konfidenzintervall zum größeren 
Sicherheitsgrad ist auch das längere (vgl. Abb. 7). 

— 99% — 

I— 95% — I 

, 1 | — 1 h ^ 

Abb. 7 3 '° x=3j1 3 ' 2 
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3.2 Ein gefälschter Würfel wird 600-mal ausgespielt; es 
ergibt sich folgende Häufigkeitsverteilung 



Augen zahl 


1 1 


2 i 


3 ! 


4 


5 


i 6 

1 


Häufigkeit 


130 1 


70 


120 1 


80 | 


f 

1 10 


1 

90 



a) Berechnen Sie ein Konfidenzintervall zur Konf idenzzahl 
95 % für den Erwartungswert der mittleren Augenzahl. 

b) Geben Sie zur Konf idenzzahl 95 % Konfidenzintervalle 
für die Wahrscheinlichkeiten an, mit denen beim einma- 
ligen Ausspielen des Würfels eine gerade bzw. ungerade 
Augenzahl auftritt. Vergleichen Sie die Länge der bei- 
den Konfidenzintervalle. 

c) Geben Sie ein Konfidenzintervall zur Konf idenzzahl 99 % 
für die bei 600 Ausspielungen des Würfels zu erwartende 
Anzahl von Würfen mit gerader Augenzahl an. 

Lösung : 

a) Bei 600 Ausspielungen des Würfels ist die beobachtete 
mittlere Augenzahl X nach dem Zentralen Grenzwertsatz in 
guter Näherung normalverteilt, und das Intervall 

X - z /. — ; X + z .. — j 
L a/2 /n a/2 /E 

überdeckt die zu erwartende mittlere Augenzahl mit der Wahr- 
scheinlichkeit 1 - a 

_ 2 

Zur Berechnung der Realisationen von X und S benutzen 
wir folgende Hilfstabelle 



x . 

l 


n . 

l 


x . n . 
l i 


x . -x 

l 


(X^x ) 2 


(x. -x) 2 n . 

l l 


1 


130 


130 


-2,4 


5,76 


748,8 


2 


70 


1 40 


-1,4 


1 ,96 


137,2 


3 


120 


360 


-0,4 


0,16 


19,2 


4 


80 


320 


0,6 


0,36 


28,8 


5 


1 TO 


550 


1/6 


2,56 


281 ,6 


6 


90 


540 


2,6 


6,76 


608,4 


I 


600 


2040 






1 1 824,0 
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Wir erhalten 



* = ek ' 2 040 = 3 ' 4 

s 2 = — ! — 1 824 = 3,04 
599 

s = 1 ,7436 . 

Für die Konfidenzzahl 95 % ergibt sich der z a /2~ Wert 
1,96 . Damit folgt 



z 



a/2 



s 

/n 



1 ,96 



1 ,7436 
/600 



0,1395 . 



Für die zu erwartende mittlere Augenzahl erhalten wir bei 
Zugrundelegung der Konfidenzzahl 95 % das Konfidenzinter- 
vall 



[3,2605 ; 3,5395 ] . 

b) Wir bezeichnen mit 0 die Wahrscheinlichkeit, mit der 
das einmalige Ausspielen des Würfels zu einer geraden Augen 
zahl führt. Wir können 0 schätzen durch die relative Häu- 
figkeit P , mit der bei den 600 Ausspielungen gerade Augen 
zahlen auftreten. Aus der Häufigkeitstabelle ergibt sich 

p = 7P+8.0+90 = 0,4 . 

600 

Da der Stichprobenumfang 600 beträgt, ist P näherungs- 
weise normalverteilt, und das Intervall 



P - z 



a/2 



P(1-P) 



/ ^ 1 

V~ 



P + 




(D 



überdeckt 0 mit der Wahrscheinlichkeit 1 - a . Für die 
Konfidenzzahl 95 % ergibt sich z a /2 = ' un< ^ wir 

erhalten 
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z 



1 ,96 



0 , 4 * 0 , 6 
600 



1 ,96-0,02 = 0,0392 . 



a/2 Y 



/ p(1-p) 



Folglich ist das Intervall 
[0,3608 ; 0,4392 ] 

ein Konfidenzintervall für 6 zur Konf idenzzahl 95 % . 

Die Wahrscheinlichkeit, mit der das Ausspielen des Würfels 
zu einer ungeraden Augenzahl führt, ist 1 - 0 . Wir schät- 
zen 1 - 0 durch die relative Häufigkeit, mit der bei den 
600 Ausspielungen ungerade Augenzahlen auftreten, also durch 
1 - P . Folglich erhalten wir ein Konfidenzintervall für 
1-0 , wenn wir in (1) P ersetzen durch 1 - P . Das 

Intervall 



1-P 



a/2 



(1-P)P 



n 



1-P -i- 



Z a/2 V 



(I-P)P ' 

n 



J 



überdeckt 1 - 0 mit der Wahrscheinlichkeit 1 - a 

Die Konfidenzintervalle für 0 und 1 - 0 besitzen also 

beide die Länge 



2z 



a/2 



P (1-P) 
n 



was verständlich ist, denn die Zufallsvariablen P und 
1 - P besitzen dieselbe Varianz. Durch Einsetzen der Zah- 
lenwerte ergibt sich für die unbekannte Wahrscheinlichkeit, 
mit der beim Würfeln eine ungerade Augenzahl auftritt, bei 
Zugrundelegung der Konf idenzzahl 95 % das Konfidenzinter- 
vall 



0,5608 ; 0,6392 j . 
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c) Bezeichnet X beim n-maligen Ausspielen des Würfels 
die Anzahl derjenigen Würfe, die zu geraden Augenzahlen 
führen, so gilt nach Definition für den Anteilswert P 
dieser Ausspielungen 

p = ^ 

n 



oder 



X = nP . 

Daraus folgt für die zu erwartende Anzahl der Auspielungen 
mit gerader Augenzahl 

EX = EnP = nEP = n0 . 

Da mit der Wahrscheinlichkeit 1 - a die Doppelungleichung 



P - z 



“/ 2 V n 



P ( 1 ~P ) 



< 6 < P + Z 



/ P(1-P) 
a / 2 V n 



erfüllt ist, gilt mit der gleichen Wahrscheinlichkeit 



P - Z a/2 V ) = n8 = n { P + Z «/2 / 



Mit der Umformung 



n * (P ± Z a/2 V 



,/P(1-P) 



nP ± Z a/2 



1 n 2 P ( 1 -P ) 



= X + z 



a/2 



X(n-X) 



folgt dann: Das Intervall 



X - z 



a/2 y 



r X (n-xT 



+ z ,/xin^T 1 

a/2 y 



n J 
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überdeckt die erwartete Zahl derjenigen Würfe, die zu ge- 
raden Augenzahlen führen, mit der Wahrscheinlichkeit 1 - a . 

Für die Konf idenzzahl 99 % ergibt sich mit den Stichpro- 
bendaten 



z ,, = 2,575. ,/ÜÖ^T 60 

a/2 ^ n < 600 

= 2,575 • /T44 = 30,9 . 

Damit erhalten wir als Konfidenzintervall 

[209,1 ; 270,9] . 
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Auswahlverfahren und Schätzung 



1. Uneingeschränkte Zufallsauswahl 



1.1 Zufällige Auswahlverfahren 

1.1.1 Man interessiert sich gelegentlich für Mittelwerte 
und Anteilswerte vorgegebener Gesamtheiten, beispielsweise 
für das Durchschnittseinkommen aller Arbeitnehmer oder den 
Anteil derjenigen Wahlberechtigten, die eine bestimmte Par- 
tei zu wählen beabsichtigen. Meist ist es dann zwar möglich, 
in einer Vollerhebung die Merkmals ausprägungen der Elemente 
der vorgegebenen Gesamtheit - wir nennen sie im folgenden 
Grundgesamtheit - festzustellen und die interessierenden Kenn- 
zahlen zu berechnen. Um die Kosten, die mit einer Vollerhebung 
verbunden sind, zu vermeiden, zieht man es aber vor, einige 
Elemente der Grundgesamtheit auszuwählen und nur diese Ele- 
mente zu untersuchen bzw. zu befragen. Man wird überlegen, wie 
die interessierenden Mittelwerte und Anteilswerte mit Hilfe 
der anfallenden Daten geschätzt werden können. 

1.1.2 Natürlich kommen sehr unterschiedliche Auswahlver- 
fahren in Betracht. Nehmen wir beispielsweise an, man möch- 
te wissen, wie viele Lehrbücher sich die Studierenden einer 
Universität im vergangenen Semester gekauft haben. Dann 
könnte man die Teilnehmer eines Seminars befragen; man könn- 
te sich auch an den Mensaeingang stellen und jeden Ankommen- 
den, vielleicht auch nur jeden 10. Ankommenden befragen. 
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Keine dieser Vorgehensweisen ist sehr sinnvoll. An dem Se- 
minar nehmen sicherlich Studierende höherer Semester teil, 
vermutlich gerade besonders aktive. Und vielleicht zwingt 
die Teilnahme an diesem Seminar, einige Literatur zu kau- 
fen. Wie sollte dann von den Ergebnissen der Seminarbefra- 
gung auf Bücherkäufe aller Studierenden geschlossen werden? 

Ähnliche Einwände können gegen das zweite Verfahren vorge- 
bracht werden. Vermutlich essen Studierende, die überdurch- 
schnittlich viel Geld zur Verfügung haben, weniger oft in 
der Mensa. Sie werden bei dem beschriebenen Verfahren also 
kaum erfaßt, obwohl sie eventuell wesentlich mehr Geld für 
Bücherkäufe ausgeben als die übrigen Studierenden. 

1.1.3 In der Markt- und Meinungsforschung wählt man zu be- 
fragende Personen oft nach dem sog. Quotenverfahren aus. 
Dabei gibt man dem Interviewer Quoten für einige Merkmale 
vor, die mit dem eigentlich interessierenden Merkmal mög- 
lichst eng Zusammenhängen sollen. Man schreibt ihm also bei 
spielsweise vor, wieviel Prozent seiner Befragten Frauen 
und wieviel Prozent über 50 Jahre alt sein sollen, wenn man 
glaubt, das interessierende Merkmal hänge mit den Merkmalen 
"Geschlecht" und "Alter" zusammen. Der Interviewer muß die 
Quoten einhalten, hat aber im übrigen völlig freie Hand bei 
der Auswahl der Personen, die er befragen will. Gegebenen- 
falls muß er also dafür sorgen, daß 50 % seiner Befragten 
Frauen sind und daß 30 % älter als 50 Jahre sind. Alles wei 
tere bleibt ihm überlassen. 

Man hofft, durch die Vorgabe von Quoten zu erreichen, daß 
die Teilmenge der ausgewählten Personen sich hinsichtlich 
des interessierenden Merkmals ebenso zusammensetzt wie die 
Grundgesamtheit . 

Aufgrund der subjektiven Einflüsse des Interviewers auf das 
Auswahlverfahren hat man keine Möglichkeit zu beurteilen, 
wie weit man im Einzelfall von diesem Ziel entfernt ist, 
weshalb es auch nicht möglich ist, die Zuverlässigkeit von 
Aussagen zu beurteilen, zu denen man bei einem Quotenver- 
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fahren gelangt 



1.1.4 Wir kommen auf die Auswahl von Studierenden einer 
Universität zurück und nehmen an, es existiere eine Kartei 
aller Studierenden dieser Universität. Dann kann man einige 
Karteikarten zufällig herausgreifen - so wie man Kugeln aus 
einer Urne zieht - und die damit erfaßten Studierenden auf- 
suchen und befragen. Dieses Verfahren ist sicherlich auf- 
wendiger als die früher ins Auge gefaßte Befragung der Teil- 
nehmer eines Seminars oder die Befragung vor der Mensa. Da 
die Auswahl aber allein vom Ausgang eines Zufallsexperiments 
abhängt und subjektive Einflüsse ausgeschaltet sind, können 
wir die Zuverlässigkeit abgeleiteter Aussagen mit den Metho- 
den der Wahrscheinlichkeitsrechnung charakterisieren. 

1.1.5 Jedes Zufallsexperiment, das dazu dient, Elemente 
einer Grundgesamtheit auszuwählen, bezeichnet man als zu- 
fälliges Auswahlverfahren oder als Ziehen einer Zufallsstich- 
probe . Da wir im folgenden ausschließlich zufällige Auswahl- 
verfahren betrachten, wollen wir im allgemeinen auf den Zu- 
satz "zufällig" verzichten und kürzer von "Auswahlverfahren" 
bzw. vom "Ziehen einer Stichprobe" sprechen. 

Zwei Auswahlverfahren haben wir in W 1.3.3 und W 1.7.4 bereits 
kennengelernt: das Ziehen ohne Zurücklegen und das Ziehen 
mit Zurücklegen. Mit diesen beiden Verfahren, die wir unter 
der Bezeichnung uneingeschränkte Zufallsauswahl zusammen- 
fassen, beschäftigen wir uns im vorliegenden Abschnitt. Im 
nächsten Abschnitt betrachten wir eine Modifikation der un- 
eingeschränkten Zufallsauswahl. 

Prinzipiell ist es stets möglich, die uneingeschränkte Zu- 
fallsauswahl unter Verwendung einer mit Kugeln gefüllten 
Urne durchzuführen. Man braucht die Elemente der Grundge- 
samtheit nur zu numerieren, füllt eine Urne mit Kugeln, die 
dieselben Nummern tragen wie die Elemente der Grundgesamt- 
heit und betrachtet die Elemente als ausgewählt, deren Num- 
mern bei der Ziehung aus der Urne auf treten. In der Praxis 
wird man natürlich andere Auswahltechniken verwenden. Auf 
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diese Techniken gehen wir erst in 1.5 ein. 



1.2 Stichprobenmittel und Stichprobenvarianz 

1.2.1 Eine Grundgesamtheit bestehe aus N Elementen und es 
interessiere ein Merkmal mit den Ausprägungen , . .., x^ . 

Wenn wir die Anzahl der Elemente, deren Ausprägung x^ ist, 
mit N i bezeichnen (i = 1, 2, ..., I), gilt also 

I 

N = E N . . 



Wir setzen 



y 



1 

N 



I 

I N.x. 
1 1 1 



1 1 x 2 
- Z N.(X. - y) 



und nennen y und a 2 arithmetisches Mittel bzw. Varianz 
des interessierenden Merkmals in der Grundgesamtheit. 



Nun werde ein Element der Grundgesamtheit zufällig ausge- 
wählt. Die Zufallsvariable X Q gebe an, welche Ausprägung 
des interessierenden Merkmals das ausgewählte Element be- 
sitzt. Dann hat X Q die Wahrscheinlichkeitstabelle 
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und es folgt 



EX = E x.N./N = y 
o 1 l' H 

var X Q = I (x ± - y) 2 N i /N = a 2 . 

1.2.2 Jetzt nehmen wir an, aus der betrachteten Grundge- 
samtheit wähle man n Elemente durch Ziehen mit Zurücklegen 
aus. X^ sei die Merkmalsausprägung des an i-ter Stelle ge- 
zogenen Elements (i = 1, 2, ..., n) . X 1 , X 2 , ..., X n sind 
dann unabhängige Zufallsvariablen, die dieselbe Verteilungs- 
funktion wie X q besitzen (vgl. 1.2.1). ( X ^ , X 2 , ..., X ) ist 

also eine Stichprobe aus der Verteilung von X Q ; 

n 

X = 1 y X. 
n i 

ist als Stichprobenmittel zu bezeichnen und 

2 Ir - 2 

s (x i - x > 

als Stichprobenvarianz. 

Weil nach 1.2.1 für i = 1, 2, ..., n gilt 



EX ± = y 

w 2 
var X^ = o 

erhält man nach W 3.5.3 

EX = y (1) 

2 

var X = (2) 

Nach W 3.5.4 gilt weiter 
2 2 

ES Z = g . (3) 
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1.2.3 Nun werde n-mal ohne Zurücklegen gezogen und mit 
- wie in 1.2.2 - die Merkmalsausprägung des an i-ter Stelle 
gezogenen Elements bezeichnet (i = 1, 2, . .., n) . Da die 

Zufallsvariablen , X ^ , . .., X^ abhängig sind, ist (X^ , X^ , 

. . . , X ) keine Stichprobe aus der Verteilung von X . Es 
liegt aber nahe, 



i n 

"5 ? V 



n^T \ (X i *> 2 



auch jetzt als Stichprobenmittel bzw. als Stichprobenvarianz 

zu bezeichnen. Wir wollen zeigen, daß gilt 



EX 



(4) 



var X = 



o_ N-n 
n N-1 



(5) 



ES' 



N 2 

o . 



N-1 



( 6 ) 



1.2.4* Die Häufigkeiten, mit denen die Ausprägungen , 

. . . , Xj. bei n-maligem Ziehen ohne Zurücklegen beobachtet 
werden, seien , n^/ . n^ . Offensichtlich sind n^ , ri 2 , 

..., n^. Zufallsvariablen, die polyhypergeometrisch verteilt 
sind mit den Parametern n, N^ , N 2 , . .., N^. Nach W 4.5 gilt 

also für i, j = 1, 2, ..., I; i^j 

N. 

En . = n -r=- 

1 N 



var n . 
1 




(1 



N . 
1 

N 



N-n 

N-1 



cov (n^n^) 



N . N . 



-1 



N N 



N-n 

N-1 * 
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Wegen 



X = - Z x . n . 
n 11 



erhalten wir also 



EX = - E x. En. 
n 11 



= y 



i r 2 

var X = — =■ E x. var n. + Z x.x. 

n 2L 1 1 i« 1 3 



< n i ,n i ) . 



3 cov -i'-r 



= i r z x 2 ü (1 _ _ z xx “i »zs 

n L X i N U N X i X j N N J N -1 



Wegen 



2 N _i 
*i N 



N . 




N . N . 


-±) - 


Z x.x. 


_2 


N ' 


i*i 1 3 


N N 


N. 




N. N. 


l 


Z x.x. 


-JL 


N 


i,j 1 3 


N N 


'i (x i 


- v) 2 





ergibt sich schließlich 



n o Z N-n 
Var X * — tFT 



( 4 ) und ( 5 ) sind damit bewiesen. 
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1.2.5* Man hat (beim Ziehen mit und beim Ziehen ohne Zu- 
rücklegen) 



s 2 = e [ (x i - U) - (X - y)] 2 

= — L I ! (X. - y ) 2 - 2 ( X . - y) (X - y) + (X - y) 2 J 
n - 1 l i l 

= jUy Z (X ± - y ) 2 - Z (X i - y) (X - y) 

+ _1t z (X - y ) 2 . 

Wegen 

Z (X i - y) (X - y) = (X - y) Z (X ± - y) 

= n (X - y ) 2 
Z (X - y) 2 = n(X - y ) 2 

folgt also 

s 2 = ^ z (Xi - y) 2 - (X - U) 2 . 

Aus der letzten Gleichung erhält man wegen der Linearität 
der Erwartungswertbildung 

ES 2 = -fr z E(X. - y) 2 - E(x - y) 2 . 

n- 1 i n- i 

Weil (beim Ziehen mit und beim Ziehen ohne Zurücklegen) für 

i = 1 , 2 , . . . , n 

EX i = p 

2 

var = er 
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1.3 Schätzung des Mittelwerts und der Varianz 
einer Grundgesamtheit 

1.3.1 Wir betrachten weiter die uneingeschränkte Zufalls- 
auswahl und verwenden y, a 2 , X und in der bisherigen Be- 
deutung. Nach 1.2.2 und 1.2.3 ist das Stichprobenmittel X 
beim Ziehen mit und beim Ziehen ohne Zurücklegen eine erwar- 
tungstreue Schätz funktion für den Mittelwert y der Grundge- 
samtheit. Die Stichprobenvarianz S ist nach 1.2.5 nur beim 
Ziehen mit Zurücklegen erwartungs treue Schätzfunktion für a 2 
Wenn ohne Zurücklegen gezogen wird und a 2 erwartungs treu ge- 
schätzt werden soll, hat man 

N-1 q 2 
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zu verwenden. 

Aus S 1.2.4 bzw. S 1.4.1 ergibt sich, daß X und S 2 im Falle 
des Ziehens mit Zurücklegen konsistente Schätzfunktionen für 
y bzw. a 2 sind. 

1.3.2 In 1.2.2 haben wir uns überlegt, daß (X^ , , . .., X^) 

beim Ziehen mit Zurücklegen eine Stichprobe ist. Nach S 2.3.4 
ist dann das Intervall 



X 




X + 



a/2 




(D 



bei großem Stichprobenumfang n ein Konfidenzintervall zum 
Sicherheitsgrad 1 - a für y. 

1.3.3 Wenn ohne Zurücklegen gezogen wird, sind die Zufalls- 
variablen X ^ , X 2 , ..., X n nicht unabhängig. Die Überlegungen 

in Abschnitt S 2.3 gestatten daher nicht unmittelbar, ein 
Konfidenzintervall für y zu konstruieren. Ist der Auswahl- 
satz n/N jedoch klein, so besteht zwischen dem Ziehen mit 
Zurücklegen und dem Ziehen ohne Zurücklegen kein wesentli- 
cher Unterschied. Wir wollen daher das Intervall (1) auch 
beim Ziehen ohne Zurücklegen als Konfidenzintervall zum 
Sicherheitsgrad 1 - a für y ansehen, falls n > 50 und 
n/N < 0,05 gilt. 



1.4 Schätzung eines Anteilswertes 

1.4.1 Wir betrachten weiter die uneingeschränkte Zufalls- 
auswahl von n Elementen aus einer Grundgesamtheit vom Um- 
fang N. Wir nehmen jedoch an, man interessiere sich für den 
Quotienten M/N , wobei M die Anzahl derjenigen Elemente der 
Grundgesamtheit ist, die eine gerade interessierende Eigen- 
schaft aufweisen. Man denke etwa daran, daß mit M die Anzahl 
derjenigen Studierenden einer Fakultät gemeint ist, die sich 
im 1. Semester befinden. 
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1.4.2 Wir bezeichnen mit X die Anzahl und mit P den Anteil 
derjenigen Ziehungen, die zur Auswahl eines Elementes mit 
der interessierenden Eigenschaft führen. Es gilt also 



Nach W 4.1.4 nennt man P im Falle des Ziehens mit Zurückle- 
gen Stichprobenanteil; es liegt nahe, dieselbe Bezeichnung 
auch im Falle des Ziehens ohne Zurücklegen zu verwenden. 

1.4.3 Nach W 4.3.6 ist X binomialverteilt mit den Parame- 
tern n und M/N , wenn mit Zurücklegen gezogen wird, und hyper- 
geometrisch verteilt mit den Parametern n, N und M, wenn 
ohne Zurücklegen gezogen wird. Demnach gilt in beiden Fällen 



und daher 

EP = E (-) = - EX 
n n 

= M 

N * 

Der Stichprobenanteil P ist also bei uneingeschränkter Zu- 
fallsauswahl erwartungstreue Schätzfunktion für den Anteil M/N 
der Grundgesamtheit. 

1.4.4 Wenn n eine große Zahl ist und n-mal mit Zurücklegen 
gezogen wird, ist das Intervall 



P - z 



a/2 



P (1-P) 



P + Z a/2 " 



P (1-P) 



nach S 2.3.5 ein Vertrauensintervall zum Sicherheitsgrad 
1 - a für den Anteilswert M/N. Das angegebene Intervall kann 
auch im Falle des Ziehens ohne Zurücklegen als Vertrauens- 
intervall zum Sicherheitsgrad 1 - a für M/N angesehen werden, 
sofern n groß und n/N klein sind. Hierzu vergleiche man 1.3.3. 
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1.5 Auswahltechniken 



1.5.1 Bei der praktischen Durchführung einer uneingeschränk- 
ten Zufallsauswahl nimmt man häufig sogenannte " Zu f alls zahlen- 
tafeln" zu Hilfe. Eine Zufallszahlentafel ist eine Folge zu- 
fällig aneinandergereihter Ziffern. Man kann sich eine sol- 
che Folge etwa dadurch entstanden denken, daß aus einer mit 
zehn von 0 bis 9 numerierten Kugeln gefüllten Urne eine 
große Anzahl von Kugeln mit Zurücklegen gezogen wird und die 
Nummern der gezogenen Kugeln in der Reihenfolge ihres Auf- 
tretens notiert werden. Im Anhang ist ein Auszug aus der in 
der Praxis sehr häufig benutzten Zufallszahlentafel von 
FISHER-YATHES wiedergegeben. Die 1. Zeile dieser Tabelle 
lautet 

03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45. 

Unserer obigen Erläuterung entsprechend stellen wir uns vor, 
daß sich beim Ziehen von Kugeln mit den Nummern 0, 1 , . . . ; 9 

zunächst die Ziffer 0, dann die Ziffer 3, dann die 4, die 7, 
wiederum die 3, die 8, die 6, die 3, ... ergeben haben. 



Sind die Elemente der Grundgesamtheit von 1 bis N numeriert 
und ist N eine k-stellige Zahl, so geht man, an irgendeiner 
Stelle beginnend, in bestimmter Regel (etwa zeilenweise) die 
Ziffern der Zufallszahlentafel durch und liest die ersten k 
Ziffern als k-stellige Zahl, ebenso die folgenden k Ziffern 
und so fort. Von den so entstehenden k-stelligen Zahlen wer- 
den alle, die zwischen 1 und N liegen, notiert. Sind n (Stich- 
probenumfang) solcher Zahlen gefunden, so betrachtet man die 
Elemente der Grundgesamtheit, die diese Nummern tragen, als 
in die Stichprobe gewählt. Soll die Stichprobe ohne Zurück- 
legen gezogen werden, so hat man zusätzlich darauf zu achten, 
daß nur solche Zahlen notiert werden, die nicht schon früher 
vorgekommen sind. 
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1.5.2 Beispiel: Für die statistische Auswertung des Anzei- 

genteils einer Tageszeitung sollen von den 623 Ausgaben der 
letzten beiden Jahrgänge 20 zufällig ausgewählt werden. Wir 
numerieren dazu die 623 Ausgaben der interessierenden Tages- 
zeitung von 1 bis 623 durch. Da 623 eine dreistellige Zahl 
ist, fassen wir - an irgendeiner Stelle in unserer Zufalls- 
zahlentafel beginnend - die Ziffern zu dreistelligen Zahlen 
zusammen und berücksichtigen nur solche, die von Null ver- 
schieden und nicht größer als 623 sind. Wir brechen das Ver- 
fahren erst ab, wenn wir so 20 Zahlen zwischen 1 und 623 er- 
halten haben. Wählen wir beispielsweise die erste Ziffer 
unserer Zufallszahlentafel (vgl. A 2.2) als Startpunkt, so 
erhalten wir 



034 


743 


738 


636 


964 


736 


614 


698 


637 


162 


332 


616 


804 


597 


742 


467 


624 


281 


145 


720 


425 


332 


373 


227 


073 


607 


51 1 


676 


622 


766 


565 


026 


710 


732 


907 


978 


531 









Ausgewählt sind also die Ausgaben mit den Nummern 34, 614, 

162 usw. 

1.5.3 Die Auswahl einer Stichprobe mit Hilfe einer Zufalls- 
zahlentafel kann besonders bei großem Stichprobenumfang ei- 
nen erheblichen Aufwand verursachen. Daher verwendet man in 
der Praxis häufig einfachere Auswahltechniken. Beispiele 
sind 

a) Systematische (= periodische ) Auswahl . Soll etwa eine 
Stichprobe gezogen werden, deren Auswahlsatz 1 % beträgt, 
so wählt man willkürlich eine sogenannte Startzahl c zwi- 
schen 1 und 100 und nimmt alle Elemente mit den Nummern 
c, c+100, c+200, usw. in die Stichprobe. 

b) Schlußziffernverfahren . Eine Stichprobe, deren Auswahlsatz 
2 % beträgt, erhält man, wenn man z. B. alle Elemente mit 
den Schlußziffern 11 und 98 in die Stichprobe aufnimmt. 
Denn auf diese Weise werden pro 100 Elemente der Grund- 
gesamtheit 2 ausgewählt. 
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c) Anfangsbuchstaben- und Geburtstags verfahren werden bei 

der Personenauswahl angewendet. Das Auswahlkriterium bil- 
det dabei der Anfangsbuchstabe des Familiennamens bzw. 
das Geburtsdatum. 

1.5.4 Die in 1.5.3 unter a) und b) beschriebenen Auswahl- 
techniken sollen an einem Beispiel weiter verdeutlicht wer- 
den. 

Der Auswahlsatz bei einer Stichprobenziehung soll 0,5 % be- 
tragen. Da jedes zweihundertste Element der Grundgesamtheit 
in die Stichprobe gezogen wird, wählt man beim systematischen 
Auswahlverfahren als Startzahl ein c zwischen 1 und 200. In 
die Stichprobe werden dann die Elemente mit den Nummern 

c; c+200; c+400; c+600; c+800; c+1000 usw.; 

gezogen. Bei einem Auswahlsatz von 0,5 % ist also - ebenso 
wie bei vielen anderen Auswahlsätzen auch - jedes systema- 
tische Auswahlverfahren ein Schlußziffernverfahren. Es wer- 
den nämlich alle Elemente mit den Schlußzifferngruppen 

c; c+200; c+400; c+600 und c+800 

in die Stichprobe genommen. Sollen Elemente mit optisch gut 
erkennbaren Nummern ausgewählt werden, so wird man sich für 
c = 100 entscheiden und die Elemente mit den Nummern 

100; 300; 500; 700; 900; 1100 usw. 

in die Stichprobe ziehen. 

Der Auswahlsatz von 0,5 % wird aber auch eingehalten, wenn 
man z. B. alle Elemente mit den Schlußzifferngruppen 

100; 200; 500; 600 und 800 

in die Stichprobe aufnimmt. Dieses Schlußziffernverfahren 
ist kein systematisches Auswahlverfahren. 
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1.5.5 Die in 1.5.3 geschilderten Auswahltechniken sind nur 
bei "gut gemischten" Grundgesamtheiten zulässig, bei denen 
sichergestellt ist, daß das Auswahlverfahren nicht die Trä- 
ger bestimmter Merkmalsausprägungen begünstigt. Wir verwei- 
sen in diesem Zusammenhang auf KELLERER (1963) . Um die Pro- 
bleme zu verdeutlichen, die mit einem Anfangsbuchstabenver- 
fahren verbunden sind, geben wir ein von SCHOTT 1 ^ stammen- 
des und von KELLERER (1963) S. 58/59 zitiertes Beispiel 
wieder : 

"Von den alphabetisch geordneten Familienbögen der Stadt 
Mannheim aus dem Anfang des 19. Jahrhunderts wurden will- 
kürlich die mit den Buchstaben A, B und M beginnenden nach 
der Kinderzahl einer Familie ausgezählt; die zur Vorsorge 
indessen doch noch durchgeführte Auszählung sämtli- 
cher Familien nach der Kinderzahl zeigte aber weit grö 
ßere Unterschiede, als sie theoretisch zulässig gewesen wä- 
ren. Erst die genaue Nachforschung ergab den Grund: unter 
den genannten Anfangsbuchstaben fanden sich verhältnismäßig 
sehr viel jüdische Namen; die jüdischen Ehen waren aber da- 
mals in Mannheim im ganzen kinderreicher als die christli- 
chen. ..." 



1) Vgl.: S. SCHOTT: Statistik, S. 44. Leipzig, Berlin: B. G 
Teubner, 1923. 
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2. Geschichtetes Stichprobenverfahren 



2.1 Schichtung einer Grundgesamtheit 

2.1.1 Häufig ist eine Zerlegung der Grundgesamtheit in Teil- 
gesamtheiten, sogenannte Schichten , vorgegeben. Es empfiehlt 
sich in einem solchen Fall, bei der Stichprobenziehung und 
ebenso bei der anschließenden Schätzung diese Zerlegung in 
geeigneter Weise zu berücksichtigen. Denn einmal interessiert 
oft nicht nur der Durchschnittswert eines Merkmals für die 
Grundgesamtheit, sondern es interessieren auch Durchschnitts- 
werte für die Schichten. Zum anderen zeigt sich, daß die Ge- 
nauigkeit der Schätzungen durch eine geeignete Aufteilung 
der Stichprobe auf die einzelnen Schichten verbessert werden 
kann, und zwar in dem Sinne, daß die Varianzen geeigneter 
Schätzfunktionen in der Regel kleiner sind als bei uneinge- 
schränkter Zufallsauswahl. 

2.1.2 Betrachten wir eine Grundgesamtheit, die in H Schich- 
ten zerlegt sei. Die h-te Schicht enthalte Elemente, so 
daß gilt 

H 



, x 2 , ..., x ^ seien die Ausprägungen eines gerade inter- 
essierenden Merkmals. gebe an, wie oft die Ausprägung x^ 

in der h-ten Schicht vorkommt (h = 1 , 2, ..., H; i = 1, 2, 

. . . , I) . Man hat dann für h = 1 , 2 , . . . , H 

I 
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Offenbar sind 



N, 1, N hi x i 



\ = 57 .1 N hi (x i " w h r 



Mittelwert und Varianz der h-ten Schicht (h = 1, 2, H) 



2.1.3 Wenn y der Mittelwert der Grundgesamtheit ist, hat 



i H 1 

= rlr y T N, . x. 

N h=i i=i hl 1 



1 H I 

~ N ^ ^h N“ ^ ^hi X i 

w h=1 n i=1 ni 1 



— V h 

. 1 . N • 



Für die Varianz a der Grundgesamtheit gilt 



° 2 = ir n N hi (x. - u) 2 . 



Wegen 



I N h .(x. - y) = I N h . 



i [ (x i " V + (y h ' w) ]‘ 



‘ I N hi (X i - V" + V*h - ^ 



folgt 



N, 9 N. 0 

JfT a h + l!T^h-^ 2 - 

h h 
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2.2 Schätzung von Mittelwerten und Anteilswerten 



2.2.1 Wir wollen den unbekannten Mittelwert y der Grundge- 
samtheit schätzen. Dazu ziehen wir aus Schicht h (h = 1, 2, 
. .., H) eine Teilstichprobe vom Umfang n^ und zwar so, daß 
für den vorgegebenen Stichprobenumfang n gilt 

n = n^ + n 2 + ... + n H • 



Bezeichnen wir mit die i-te Beobachtung aus der h-ten 

Schicht, so ist das Stichprobenmittel der Schicht h 



= i- i 

n_ . L . 



h i=1 



hi 



und die Stichprobenvarianz der Schicht h 



1 



u h 

-V x 

h i = 1 



, . - X, ) 2 . 
hi h 



2.2.2 Es liegt nahe, y wie bisher durch das Stichproben- 
mittel 



1 H 

1 I 

•n 



“h 

I X 



h=1 i=1 



hi 



n 



H 



h=1 



n h 



“h 

- I x 

h i=1 



hi 



H 



- I 

h=1 



% 

n 



X 



h 



zu schätzen. X ist aber keine dem geschichteten Stichproben- 
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verfahren angepaßte Schätzfunktion, denn im allgemeinen ist 



EX f y. 



Dagegen ist 



X 



S 



H 



I 



h=1 



N, 

N h 



als Schätz funktion für y unverzerrt. Wegen (1) gilt nämlich 



EX 



S 



H 



I 

h=1 




H N, 
r h 
L Vy 

h=1 



y . 



2.2.3 Wir berechnen nun die Varianz von X g . Da die Teil- 
stichproben alle aus verschiedenen Schichten stammen, sind 
die Zufallsvariablen X^ (h = 1 , 2 , . . . , H) unabhängig. Also 

gilt 



H / N. 



var X = l 

b h=1 X 



var X^ . 



Weil man 



2 

( °h 



var X h = \ 



% N h' n h 

n h V 1 



beim Ziehen mit Zurücklegen 



beim Ziehen ohne Zurücklegen 



hat, folgt 



var X,. 



H /N h \ 2 *1 



= j 1 _£) 



( 3 ) 



h=1 “ h 

beim Ziehen mit Zurücklegen und 
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var X r 



i Cjl Y 

hii v N y n h 



N h- n h 



, N, -1 
h n 



beim Ziehen ohne Zurücklegen. Dabei muß der Korrektur- 
faktor nur für Schichten berücksichtigt werden, deren Aus- 
wahlsätze über 0,05 liegen. 

2.2.4 Jetzt nehmen wir an, es werde entweder in allen Schich- 
ten mit Zurücklegen gezogen oder es werde zwar ohne Zurück- 
legen gezogen, man habe jedoch Auswahlsätze von höchstens 
0,05. Außerdem gelte in beiden Fällen n^ > 50 für h = 1, 2, 

..., H. Dann ist X, annähernd normalverteilt mit dem Erwar- 

n 2 - 
tungswert y^ und der Varianz a^/n^. Folglich ist X g annähernd 

normalverteilt mit dem Erwartungswert y und der Varianz 




ein Konfidenzintervall zum Sicherheitsgrad 1 - a für y ist. 

2 2 

Ersetzt man in den Intervallgrenzen durch S^ , was wegen 
n^ > 50 zulässig ist (h = 1, 2, ..., H) , so erhält man aus 
dem vorangehenden Konfidenzintervall das für die Praxis viel 
wichtigere Konfidenzintervall 




2.2.5 Die hier durchgeführten Überlegungen gelten sinngemäß 
auch für Anteilswerte. Bezeichnet 6 den Anteilswert des Un- 
tersuchungsmerkmals in der Grundgesamtheit, 0^ den entspre- 
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chenden Anteilswert in der h-ten Schicht und P, den Anteils- 

h 

wert in der aus der h-ten Schicht entnommenen Teilstichprobe, 
so ist 



H 

= l 

h=1 



eine erwartungstreue Schätzfunktion für e, und für die Varianz 
von P g gilt 



var p s 



H 9 h (i-e h ) 

h=1 v N y n h 



beim Ziehen mit Zurücklegen und 



var p s 



? rM 2 6 h (1 - e h ) N h- n h 

h -A N ' n h v 1 



beim Ziehen ohne Zurücklegen. 

2.2.6 Wenn man für h = 1 , 2 , . . . , H hat n, > 50 und wenn 

h = 

mit Zurücklegen gezogen wird bzw. n^/N^ < 0,05 erfüllt ist 
im Falle des Ziehens ohne Zurücklegen, überdeckt das Inter- 
vall 




den unbekannten Wert 0 mit der Wahrscheinlichkeit 1 - a. 
Man wird also 




als Konfidenzintervall zum Sicherheitsgrad 1 - a für 6 be- 
nützen. 
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2.3 Aufteilung einer Stichprobe auf die Schichten 



2.3.1 Wir haben bisher nichts über die Aufteilung der Ge- 
samtstichprobe auf die einzelnen Schichten vereinbart. Nahe- 
liegend ist die sog. proportionale Aufteilung , bei der der 
Umfang jeder Teilstichprobe proportional zur Größe der Schicht 
gewählt wird, aus der sie gezogen wird 



n 



h 




h = 1, 2, ..., H 



( 1 ) 



Bei proportionaler Aufteilung hat man für alle Schichten 
denselben Auswahlsatz n/N. Wenn die Quotienten nN^/N nicht 
ganzzahlig sind, muß natürlich auf- bzw. abgerundet werden. 
Die Auswahlsätze der einzelnen Schichten unterscheiden sich 
auch nach diesen Rundungen nur unwesentlich. 



Setzen wir (1) in 2.2.3 (3) ein, so erhalten wir 



var Xg 



H 



l 



h=1 




1 T 

n l N 



2 

V 



Wir wollen diese Varianz mit der Varianz des Stichproben- 
mittels X bei uneingeschränkter Zufallsauswahl vergleichen. 
Unter Berücksichtigung von 2.1.3 (2) folgt 



var X 



2 

o 

n 



nN 



H 



I 

h= 1 



N h°h 



+ 



nN 



H 



I 

h=1 



V^h 



y ) 



2 



-- var Xg 



nN 



H 



I 



h=1 



N h^h 



y 



2 



> var Xg . 
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Bei proportionaler Aufteilung ist die Varianz von X g also 
nie größer als die Varianz von X. Der Unterschied zwischen 
beiden Varianzen ist besonders deutlich, wenn sich die Mit- 
telwerte in den Schichten erheblich vom Mittelwert in der 
Grundgesamtheit unterscheiden. Man bezeichnet die durch die 
Schichtung bewirkte Steigerung der Genauigkeit der Schätzung 
als Sohichtungse ff ekt . 

2.3.2 Daß nicht jede beliebige Aufteilung einer Stichprobe 
auf Schichten zu einer Steigerung der Genauigkeit führt, 
zeigt das folgende Beispiel. 

Man habe H = 3 und 



h 


N h 




2 

°h 


n h 


1 


100 


7 


10 


2 


2 


50 


10 


0 


16 


3 


150 


12 


5 


2 


E 


300 






20 



Dann gilt 

y = (100-7 + 50-10 + 150-12) = 10 

a 2 = _1_ (100-10 + 150-5 + 1 00 (7—10)2 + 150(12-10) 2 ) 

3250 

300 



und daher 



2 

- a 

var X = — 



3250 

6000 



< 1 



var X = — Ur- ( 1 00 2 » 10/2 + 150 2 -5/2) 
b 300 Z 



106250 ^ i 

90000 
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Es folgt also für unser Beispiel 



var X s > var X. 

2.3.3 Wir wollen uns überlegen, bei welcher Aufteilung der 
Stichprobe auf die Schichten var Xg minimal wird. Dabei un- 
terstellen wir, daß mit Zurücklegen gezogen wird. Wir haben 
demnach 



F 



var Xg 




o 

"n 



2 

h 

h 



als Funktion der Variablen n^, , . . . , n^ unter der Neben- 

bedingung 

I n, = n (2) 

h 

zu minimieren. Für n^ , n^ mit (2) stimmt nun offen- 

bar die Funktion 

F x = Kr 1 ) ir + x(rn h - n) 

h 



bei beliebiger Wahl der reellen Zahl X mit der Funktion F 
überein. Es gilt 



F 



X 





Xn 




2 



N G h 



/T + Xn h 



Xn + 2 l 



/X 



= I 



r N h G h 



L N 



Ai, 



- ✓ Xn, 



" Xn + 2 l — a ,/X 



Die Funktion F^ nimmt also ihr Minimum an für 
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( 3 ) 



Vh 

N fx 



Wir wählen X so, daß (2) erfüllt ist und erhalten 



Zn h 



Z N h°h 
N /T 



n 



oder gleichbedeutend 
Z N, a. 



/X = 



' h h 



Nn 



Aus (3) folgt dann 



N h°h 

n. = -r— ■ n; 

h Z N, g, 
h h 



1 , 2 , ... 



(4) 



Bei der angegebenen Wahl von X ist für die Stichproben- 
umfänge (4) minimal. Diese Stichprobenumfänge genügen der 
Nebenbedingung (2) . Da F und F^ bei Gültigkeit der Nebenbe- 
dingung identisch sind, ist durch (4) das gesuchte Minimum 
der Funktion F gegeben. 



Wenn (4) gilt, spricht man von optimaler Aufteilung der Stich- 
probe. Bei der optimalen Aufteilung werden aus denjenigen 
Schichten, deren Umfänge und deren Standardabweichungen groß 
sind, relativ viele Elemente in die Stichprobe aufgenommen. 
Insbesondere erfordert die optimale Aufteilung der Stichprobe 
die Kenntnis der bzw. von Schätzwerten für a^, und zwar 
bereits vor der Stichprobenziehung. Für Schätzungen von a h 
kommen daher - will man sich nicht auf reine Vermutungen 
verlassen - nur Werte aus früheren Erhebungen bzw. Vorunter- 
suchungen in Frage. Die optimale Aufteilung läßt sich des- 
halb in der Praxis nur näherungsweise verwirklichen. 



214 




3. Berücksichtigung von Vorkenntnissen in 
der Schätzfunktion 



3.1 Zur Einführung soll das folgende Beispiel dienen.^ 
Aufgrund einer Vollerhebung sei bekannt, daß die 50 Großbe- 
triebe einer Stadt am 15. 1. 1965 insgesamt 5000 Mitarbeiter 

beschäftigten, so daß die durchschnittliche Mitarbeiterzahl 

pro Betrieb y = = 100 betrug. Am 1 5 . 1. 1970 wählt 

2 ) 

man 5 Betriebe zufällig aus und stellt folgende Daten fest 
1 Zahl der Mitarbeiter 



Betrieb 


; am 15. 1 . 1965 


am 15.1.1970 


1 


80 


■ 85 


2 


1 10 


1 120 


3 


90 


; 98 


4 


100 


1 1 8 


5 


70 


74 


I 


450 


495 



Verwendet man das übliche Stichprobenmittel als Schätzfunk- 
tion für y , so erhält man als Schätzwert für die durch- 
schnittliche Mitarbeiterzahl am 1 5 . 1. 1970 



Man kommt also zu dem Schluß, die durchschnittliche Mitar- 
beiterzahl sei gesunken, obwohl - wie man der Tabelle ent- 
nimmt - in jedem der 5 ausgewählten Betriebe die Zahl der 
Mitarbeiter im Vergleichszeitraum gestiegen ist. Da in den 
5 ausgewählten Betrieben die frühere durchschnittliche 



Bezüglich des Beispiels und der Ergebnisse dieses Ab- 
schnitts vgl. STENGER (1971), S. 101 ff. 

Wir betrachten in diesem Abschnitt Ergebnisse der Einfach- 
heit halber nur für Ziehungsvorschrift mit Zurücklegen; 
bezüglich der entsprechenden Ergebnisse bei Ziehungsvor- 
schrift ohne Zurücklegen sei auf die Literatur verwiesen. 
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Mitarbeiterzahl mit 



450 

5 



90 



deutlich unter der damaligen durchschnittlichen Mitarbeiter- 
zahl aller 50 Großbetriebe liegt, sind in der Zufallsstich- 
probe offenbar die Betriebe, die 1965 eine niedrige Mitar- 
beiterzahl hatten, überrepräsentiert. Sicherlich wird des- 
halb auch die durchschnittliche Mitarbeiterzahl aller Groß- 
betriebe für 1970 mit 99 zu niedrig geschätzt. Die ermittelten 
Zahlen legen nahe zu vermuten, daß auch in den nicht ausge- 
wählten Betrieben die Mitarbeiterzahl gestiegen ist und sich 
somit die durchschnittliche Beschäftigtenzahl gegenüber 1965 
erhöht hat. Wir werden im folgenden Schätzverfahren kennen- 
lernen, die Vorkenntnisse, wie sie z. B. im obigen Falle 
vorliegen, berücksichtigen und insofern den bisher betrach- 
teten Schätzverfahren überlegen sind. 



3.2 X und ^ seien Merkmale mit den Ausprägungen 
x 1 , x 2 , ..., x z bzw. y 1# y 2 , ..., yj . N_ sei die 
Zahl derjenigen Elemente der Grundgesamtheit, denen durch 
X und ^ die Ausprägungskombination (x^,y^) zugeordnet 
ist (i = 1 , 2, ..., I ; j = 1, 2, . . . , J) . Wir setzen 



J 



N . 

l . 


= £ 
j = 1 

I 


N. . ; 

13 


■ i = 1 , 2, ., 


I 


N . 

•3 


= E 
i=1 


N . . ; 

13 


? j = 1, 2, .. 


.., J 



und ferner 



-IN. x. 
N l.i 



M = - 2 N . y . 

y N . J l 



2 

x 

2 



-IN. (X. - y ) 
N l. i x 



= M ^ - !\ 



xy 



N“ N ij (x i- y (y j ■ y 
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3.3 Der Grundgesamtheit wird eine Stichprobe vom Umfang n 
mit Zurücklegen entnommen; und sollen angeben, 

welche Ausprägungen der Merkmale X und bei dem an 

i-ter Stelle gezogenen Element beobachtet werden 
(i = 1, 2, . . . , n) . Wir definieren die Stichprobenmomente 



X 



Y 



S 



2 

x 



S 



2 

y 



s 



xy 



n 

I 

i=1 



x . 



i 



n 

I 

i = 1 



Y . 

l 



1 

n- 1 
1 

n- 1 
1 

n-1 



n 

Z 

i = 1 

n 

Z 

i = 1 

n 

z 

i=1 



(X ± - X) 2 
(Y ± - Y) 2 
(X ± - X) (Y ± - Y) . 



Als Realisationen dieser Stichprobenmomente erhält man für 
die Zahlen unseres Beispiels in 3.1 

x = 99, y = 90, s* = 406, s y 2 = 250, s xy = 312,5. 

Ferner ist: y^ = 100, N = 50 . 

3.4 Wir betrachten als Aufgabenstellung, daß y x zu 

schätzen ist, wobei y^ bekannt oder - im Vergleich zu 

y - leicht zu ermitteln ist. Bei der Herleitung geeigneter 
x 

Schätzfunktionen orientieren wir uns an dem in 3.1 ange- 
gebenen Zahlenbeispiel. 

In den am 15. 1. 1970 ausgewählten Betrieben ist die Zahl 
der Mitarbeiter um den Faktor 



x = 495 

y 4 50 



1/1 



gestiegen. Wenn man annimmt, daß auch in den nicht ausge- 
wählten Betrieben ähnliche proportionale Zuwächse vorlie- 
gen, wird man 
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100 = 110 



x 4_9_5 

y y y 450 

als Schätzwert für die gesuchte durchschnittliche Mitarbei- 
terzahl y x verwenden. 

Man kann natürlich auch davon ausgehen, daß die Zahl der Be- 
schäftigten in den ausgewählten Betrieben insgesamt um 

(85-80) + (120-110) + (98-90) + (118-100) + (74^70) 

= (85 + 120 + 98 + 1 18 + 74) - (80 + 110 + 90 + 100 + 70) 

und durchschnittlich um 

- r. _ 85 + 120 + 98 + 118 + 74 80 + 110 + 90 + 100 + 70 

x y — ■ — ■ ■ — 9 

5 5 

zugenommen hat. Wer vermutet, in den nicht ausgewählten Be- 
trieben seien im Durchschnitt auch etwa 9 Mitarbeiter mehr 
beschäftigt, wird 

y + x - y = 100+9 = 109 

y * 

als Schätzwert für die durchschnittliche Beschäftigtenzahl 
y x verwenden. 

3.5 In 3.4 haben wir zwei unterschiedliche Vorgehenswei- 
sen kennengelernt. Im ersten Fall wurde die Schätz funkt ion 



verwendet, im zweiten Falle die Schätzfunktion 

v y + X - Y . (2) 

Während die Schätzfunktion (2) linear ist, so daß Erwartungs- 
wert und Varianz sich in einfacher Weise berechnen lassen. 
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ist die Schätzfunktion (1) nichtlinear. Es zeigt sich, daß 
sich die Momente der Schätzfunktion (1) nur für große Stich- 
probenumfänge näherungsweise angeben lassen. Wir ziehen da- 
her vor, hier nur die Schätzfunktion (2) weiter zu disku- 
tieren und erwähnen lediglich, daß man von Verhältniss ohät- 
zung spricht, wenn man die Schätzfunktion (1) verwendet. 

3.6 Die Schätzfunktion (2) läßt sich offenbar in der Gestalt 

X - (Y - y ) 

schreiben. Wir wollen allgemeiner die Schätzfunktion 
Z = X - a (Y - y y ) 

betrachten, wobei a eine vorgegebene reelle Zahl sein soll, 
die nicht unbedingt gleich 1 sein muß. Insbesondere ist da- 
bei der Spezialfall Z = X eingeschlossen (a = 0) . Wird Z 

als Schätzfunktion verwendet, so sagt man, es werde eine 
Differenzsahätzung durchgeführt. Welche Wahl von a bei 
Durchführung einer Differenzschätzung im konkreten Fall 
zweckmäßig ist, erörtern wir allgemein in 3.7 und 3.8 und 
für ein Beispiel in Aufgabe 4.3 . 

Wegen 



EX = 

EY = u y 

und der Linearität der Erwartungswertbildung ist Z eine 
erwartungstreue Schätzfunktion für ^ 

EZ = EX - aE (Y - y ) = y 

y x 

Aus W 3.4.1 (1) folgt 

var Z = var (X - aY + ay ) 

y 

= var X - 2acov (X,Y) + var Y, 
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Weil nach 1.2.2 (2) 

2 

G x 

var X = — 
n 



var Y = -£ 
n 



und entsprechend 



cov (X,Y) = 

n 



gilt, erhält man also 



Var Z = i <°x 2 - 2aa xy + “ 2 °y 2 > ' 



Für var Z ist 



I/O 2 o C 2 o 2 

~ ( S - 2aS + a S 

n x xy y 



eine erwartungstreue Schätzfunktion. 



Aus 1.2.2 folgt nämlich 



ES 2 = a 2 

x x 



ES = g 

y y 

und es gilt entsprechend 



ES = a 
xy xy 



Für die Zahlen unseres Beispiels erhalten wir mit a 
als Schätzwert für die Varianz 



■1 (406 - 2-1*312,5 + I 2 -250) = 6,2 . 
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Diesen Schätzwert wollen wir nun mit einem Schätzwert für 

die Varianz der Schätzfunktion X vergleichen. Bekanntlich 

2 

a 

ist var X = — , und als erwartungstreue Schätzfunktion 

s x 2 

für var X haben wir — — , so daß sich aus den Zahlen des 

Beispiels der Schätzwert =81,2 , also ein Vielfaches 

von 6,2 ergibt. 



3.7 Wenn man eine Differenzschätzung durchführen möchte, 
liegt es nahe, denjenigen Wert a zu verwenden, für den 
var Z minimal wird. Wir leiten also 



var Z 



1 , 2 
n a x 



2a o 



xy 



2 2 
i o 

y 



) 



nach a ab. Durch Nullsetzen der Ableitung erhalten wir 



a 



a 



2 * 

o 

y 



Empfehlenswert wäre also, die Schätzfunktion 




zu verwenden, deren Varianz gleich 




y 



ist (vgl . Abb . 1 ) . 



a 



o o 
x y 



2 “ 

) var X 
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varZ 




Abb. 1 

2 

3.8 Nun kennt man zwar (und oft auch o ^ ) nicht. Es 

ist jedoch vielfach möglich, aus früheren Erhebungen einen 

Näherungswert zu gewinnen. Auch wenn ein derartiger Nähe- 

2 

rungswert deutlich vom optimalen Wert a X y^ a y verschieden 
ist, schätzt man jedenfalls unverzerrt. Außerdem hat man 

var Z < var X 



sofern nur sichergestellt ist, daß der Näherungswert a 

y 

zwischen 0 und 2 o X y/°y üegt* Diese schwache Randbe- 
dingung für den Näherungswert wird man im allgemeinen ein- 
halten können, so daß die Differenzschätzung der Verwendung 
des Stichprobenmittels vorzuziehen ist. 



3.9 Häufig verzichtet man darauf, aus früheren Erhebungen 

2 

Näherungswerte für c /a zu beschaffen und schätzt 
2 xy y 

a /ö statt dessen mit Hilfe von 

xy y 




aus der Stichprobe. 
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Man verwendet dann also 



Z = X - 



(Y - Vy ) 



als Schätzfunktion ^ für p x 

Regres sions s chätzung durch. 



und sagt, man führe eine 



3.10 Die Schätzfunktion Z ist nicht erwartungstreu . 

Man kann jedoch zeigen, daß sie konsistent ist. Zunächst 

- - 2 

konvergieren die Stichprobenmomente X, Y, S^ , S stocha- 
stisch gegen 



v 



x ' 



xy 



bzw . 



c 



2 

y 



(vgl . W 3.6). 

Daraus folgt, daß auch 



X 



(Y 



) 



stochastisch gegen die Konstante 



y x * (y y " V = y x 

°y 

konvergiert. Man vergleiche hierzu W 3.6.2 und die dort an- 
gegebene Literatur. 

Man zeigt entsprechend, daß 




eine konsistente Schätzfunktion für var Z ist. 



Wegen der Möglichkeit S ^ =0 vgl. STENGER (1971) 

S. 108 ff. y 
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4. Aufgaben 



4.1 Für die Gewichte der Elemente einer Stichprobe aus ei- 
ner großen Grundgesamtheit ergibt sich folgende Häufigkeits- 
verteilung 



Gewicht in Gramm 


Häufigkeit n^ 


17,5 bis unter 22,5 


20 


22,5 bis unter 27,5 


40 


27,5 bis unter 32,5 


30 


32,5 bis unter 47,5 


10 



a) Geben Sie für den Mittelwert der Grundgesamtheit ein Kon- 
fidenzintervall zur Konf idenzzahl 99 % an. 

b) Berechnen Sie zur Konf idenzzahl 95 % ein Konfidenzinter- 
vall für den Anteilswert derjenigen Elemente der Grundgesamt 
heit, die weniger wiegen als 22,5 g. 

Lösung : 

a) Zur Berechnung des Stichprobenmittels und der Stichproben 

varianz in der Stichprobe legen wir die folgende Tabelle mit 

a. als Mitte der i-ten Klasse an 
i 



Klasse 


a . 
i 


n . 
i 


a . n . 

l l 


a.-x 


(a ± -x) 2 n ± 


17,5 - 


22,5 


20 


20 


400 


-7 


9 80 


22,5 - 


27,5 


25 


40 


1000 


-2 


160 


27,5 - 


32,5 


30 


30 


900 


3 


270 


32,5 - 


47,5 


40 


10 


400 


1 3 


1690 


1 




100 


2 700 




3100 
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Wir erhalten 



5 “ n E a i n i = TCÖ 2700 = 27 
s 2 « 1 E ( ai -x) 2 n. = ^ 3100 = 31. 



Da insgesamt 100 Beobachtungen vorliegen und die Grundge- 
samtheit groß (also der Auswahlsatz < 5 %) ist, ist das In- 
tervall 



"0,005 



X + z 



°' 005 /n J 



ein Konfidenzintervall zum Sicherheitsgrad 99 %. 
Kit den berechneten Werten ergibt sich 



Z 0 , 005 



S 

/n 



2,575 5 ' 5 . 6 . 78 . = i ,4337 
/100 



so daß man zum Intervall 
[25,5663; 28,4337 ] 



gelangt . 



b) Den Anteilsv/ert 0 der Elemente in der Grundgesamtheit, 
die weniger als 22,5 g wiegen, können wir durch den in der 
Stichprobe beobachteten Anteilswert P dieser Elemente schät- 
zen. Wegen n = 100 ist das Intervall 



P - z 



0,02 5 



. / p < i - 
V n 



P + z 



P(1-P) 



0,025 



ein Konfidenzintervall zum Sicherheitsgrad 95 % für 0. Man 
berechnet 



z 0,025 



J PH-p) ' 
V n 



i ,96 y 



0 , 2 - 0, 8 

100 



0,0784 



225 




und hieraus das Intervall 



[ 0 , 1 2 1 6 ; 0,2784 ] . 

4.2 In einer Region soll festgestellt werden, wie viele 
Arbeitskräfte durchschnittlich in einem landwirtschaftli- 
chen Betrieb beschäftigt sind und wie groß der Anteil der 
Familienbetriebe ist. Von den insgesamt 185 000 landwirt- 
schaftlichen Betrieben haben 120 000 bis zu 10 ha Nutzflä- 
che, 60 000 zwischen 10 und 50 ha und 5000 mehr als 50: ha. 
Man wählt bei proportionaler Aufteilung 1 % der Betriebe aus 

und ermittelt in jeder Teilstichprobe h den Durchschnitt x, 

2 h 
und die Varianz s^ für die Anzahl der Arbeitskräfte und den 

Anteil p^ der Familienbetriebe 



*h 


2 

s h 


p h 


2,8 


0,5 


0,88 


3,4 


1,4 


0,66 


6,9 


5,5 


0,12 



Berechnen Sie Konfidenzintervalle zur Konf idenzzahl 95 % 

a) für die durchschnittliche Anzahl y der Arbeitskräfte 

b) für den Anteil 6 der Familienbetriebe. 



Lösung : 



Man hat 



n 



n 



n 



1 

2 

3 



1 

100 

1 

100 

1 

100 



120 000 = 1200 
60 000 = 600 
5000 = 50 



a) Wir berechnen zunächst x g und den Schätzwert für var X g 
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6,9 



x 



S 




x 



h 



120 000 ^ o , 60 000 ^ „ , 5000 

185 000 ' 185 000 ' 185 000 



= 3,105 



I 




/ 1 20 000 \ 2 0,5 / 60 000 "\ 2 1,4 

\1 85 000 ) 1200 V 1 85 000/ 600 

/ 5000 \ 2 5,5 

V 1 85 000/ 50 



= 0,0005. 



Da zur Konf idenzzahl 95 % der Wert z = z^ = 1,96 ge- 

a 0,025 ' ^ 

hört, folgt 



z 

a 




1,9 6 v 7 0 , 0005 



- 0,044. 



Als Konfidenzintervall für y erhält man also 
: 3,061 ; 3,149 ] . 



b) Es ergibt sich 



P S 



120 000 
185 000 



0,88 



+ 



60 000 
185 000 



0,66 



+ 



5000 
1 85 000 



0,12 



= 0,788 
2 

v ( N h ^ P h (1_P h ) _ / 1 20 000^ 2 0,88*0, 12 

i\N / n, V 1 85 000. 1200 

h 

,/ 60 000 V 2 0,66*0,34 ( 5000 \ 2 0,12*0,88 

AI 85 000 ) 600 VI 85 000/ 50 

= 0,000078 
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und daher 



Z aV^^) ^-^= 1,96-0,0088 = 0,017 

h 

Wir erhalten demnach 
[ 0,771 ; 0,805 ] 
als Konfidenzintervall für 0. 



4.3 Ein Textilkonzern erwägt, in einer Großstadt eine wei- 
tere Filiale zu eröffnen. Die Entscheidung wird u. a. vom 
Ergebnis einer Kaufkraftuntersuchung für die betreffende 
Einkaufsregion abhängig gemacht. Aufgrund der Unterlagen, 
die das Statistische Amt der betreffenden Großstadt zur Ver 
fügung gestellt hat, weiß die Konzernleitung, daß das durch 
schnittliche Nettomonatseinkommen von 4-Personenhaushalten 
in der interessierenden Region bei 1840 DM liegt. Außerdem 
ist bekannt, daß 4-Personenhaushalte in der Bundesrepublik 
durchschnittlich 15 % des Nettoeinkommens für Bekleidung 
aufwenden. Zusätzlich läßt die Konzernleitung 100 solche 
Haushalte in der interessierenden Region zufällig (mit Zu- 
rücklegen) auswählen und befragen. Bezeichnen bzw. 

die Angaben des an i-ter Stelle ausgewählten Haushalts über 
die durchschnittlichen Ausgaben für Bekleidung bzw. das 
durchschnittliche Nettoeinkommen in den letzten 12 Monaten, 
so ergeben sich folgende Daten 

* = Töö E x i “ 360 

* = = 1920 

s x 2 = “gV z ( x i-x) 2 = 14 400 

s y 2 = Tr E = i 60 000 

s xy = 11 < x i- x ) (Yi-y) = 32 000 
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Wie können die durchschnittlichen monatlichen Ausgaben eines 
4-Personenhaushalts für Bekleidung in der interessierenden 
Region möglichst genau geschätzt werden? 

Lösung : 

Bezeichnen wir die durchschnittlichen monatlichen Ausgaben 
eines 4-Personenhaushalts in der interessierenden Region 
mit y , so kann erwartungs treu durch das Stichpro- 

benmittel 



X = 1CÖ ZX i 



mit der Varianz 



var X 



100 



geschätzt werden. Aus den Stichprobenwerten ergibt sich dann 



für y der Schätzwert 
x 



x = 360 



und für var X der Schätzwert 



x 

100 



144 



Zu einer anderen Schätzfunktion gelangt man durch Einbezie- 
hen der Vorinformationen. Bezeichnet y^, das durchschnitt- 
liche Nettoeinkommen von 4-Personenhaushalten in der betref- 
fenden Region, so kann aufgrund der Information, daß sol- 
che Haushalte in der Bundesrepublik durchschnittlich 15 % 
des Nettoeinkommens für Bekleidung aufwenden, 



0,15-Py 

als Näherungswert für y^ verwendet werden. Dann ist aus 
der Stichprobe nur die Differenz 
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zu schätzen, was durch 
X - 0,15 Y 

erwartungstreu möglich ist. Man verwendet in diesem Falle 
die Schätzfunktion 

Z = 0,15y y + (X - 0,15 Y ) = X - 0,15 (Y - y ) 
d. h. wir führen eine Differenzschätzung durch. Wegen 

var Z = var (X - 0,15 Y) = -L Z var (X . - 0 , 1 5 Y . ) 

n z 1 i 

kann erwartet werden, daß die Varianz von Z kleiner ist 
als 



var X = -X? E var X . , 

n 2 1 

denn Haushalte mit hohem Einkommen werden i. a. viel für 
Bekleidung aufwenden und Haushalte mit niedrigem Einkommen 
i. a. wenig, so daß die Werte der Differenzen 

X. - 0,15 Y. 

i i 

weniger streuen werden als die Werte der Zufallsvariablen 
X. . 

l 

Als Schätzwert für y x erhält man bei der Differenzschät- 
zung 



z = x - 0,15 (y - y ) = 360 - 0,15 (1920 - 1840) = 348 
und als Schätzwert für 

var Z = TSÖ [ °x 2 " 2 '°' 15a xy + °' 15 V ] 



ergibt sich 
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— 1— [ S 2 - 2-0, 15s + 0,15 2 S 2 ] 

100 L x ' xy y 

= ._L [14 400 - 0,3-32 000 + 0,0225*160 000] 



= 84 



Schließlich kann auch eine Regressionsschätzung durchge- 
führt werden. In diesem Falle erhält man für u x den 
Schätzwert 

_ s 

z = X ^ (y - u ) 

s * 

y 

= 360 - 32 Q °° - (1920 - 1840) 

1 60000 

= 344 . 

Die Schätzfunktion Z ist nicht erwartungstreu und der 
Differenzschätzung i. a. nur bei sehr großem Stichproben- 
umfang vorzuziehen. 
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Testen 



1. Grundbegriffe 

1.1 Problemstellung 

1.1.1 Stichprobenuntersuchungen führt man häufig durch, um 
festzustellen, ob vorgegebene Normen eingehalten sind. Man 
prüft beispielsweise, ob eine Werkstoffe bearbeitende Maschi- 
ne auf den richtigen Sollwert eingestellt ist. Gesundheits- 
behörden untersuchen bei Lebensmitteln, ob der Schadstof fge- 
halt die gesetzlich festgelegte Höchstgrenze nicht übersteigt. 
Eichbehörden haben das Abfüllgewicht von Fertigpackungen zu 
kontrollieren. So dürfen nach dem seit 1.1.1975 geltenden 
deutschen Eichgesetz Fertigpackungen nur so hergestellt wer- 
den, daß die Füllmenge zum Zeitpunkt der Herstellung im Durch- 
schnitt nicht kleiner ist als die auf der Packung angegebene 
Menge . ^ ^ 

1.1.2 Um ein solches Beispiel näher zu betrachten, wollen 
wir annehmen, eine Eichbehörde überprüfe eine Maschine, die 
500-Gramm-Zuckerpakete abfüllt. Da sich beim Abfüllvorgang 
und bei der Messung der eingefüllten Menge viele unkontrol- 
lierbare Einflüsse unabhängig voneinander überlagern, kön- 
nen wir die Meßwerte nach dem Zentralen Grenzwertsatz als 
normalverteilte Zufallsvariablen betrachten. Wir wollen weiter 
annehmen, daß die Streuung der Meßwerte im interessierenden 
Bereich von der Maschineneinstellung unabhängig (also kon- 



1 Zu den Einzelheiten der gesetzlichen Bestimmungen vergl. 
"test" , Jg. 1974, Heft 9, S. 437 ff. 
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stant) ist und aufgrund langjähriger Beobachtung mit o = 10 g 
angegeben werden kann. Die Meßwerte besitzen dann die Vertei- 
lungs f unktion 

F (x) = <f> (x | y ; 10) . 

Dabei ist y das unbekannte mittlere Füllgewicht der Zucker- 
pakete . 

1.1.3 Der laufenden Produktion sollen nun Zuckerpakete ent- 
nommen und kontrolliert werden. Es ist naheliegend, das in 
S 1.3 als Schätzfunktion für y verwendete Stichprobenmittel 
X zu berechnen. Für die Verteilung von X gilt 

W(X < x) = <(> ( X ] p ; 12) . 

/n 

Beträgt das mittlere Füllgewicht y der Zuckerpakete genau 
500 g, so ist das Stichprobenmittel mit der Wahrscheinlich- 
keit 1/2 kleiner als der Sollwert (vgl. Abb . 1 ) . 

<p(x 1 500; 1 0/ /TT) 




500 



Abb. 1 

Folglich kann die Eichbehörde den Hersteller nicht schon 
dann mit einem Bußgeld belegen, wenn das Stichprobenmittel 
kleiner ausfällt als 500 g. Vielmehr wird man in "vernünf- 
tiger" Weise einen kritischen Wert c unterhalb des Sollwerts 
festlegen und ein Bußgeld nur dann erheben, wenn X diesen 
Wert unterschreitet. 
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1.1.4 Bei der Festlegung von c ist zu beachten, daß der 
Hersteller - wie c auch gewählt wird - mit positiver Wahr- 
scheinlichkeit bestraft werden kann, obwohl y > 500 gilt. 

Diese Irrtumswahrscheinlichkeit ist offenbar um so kleiner, 
je kleiner c gewählt wird. Sie hängt auch davon ab, wie groß 
das tatsächliche Durchschnittsgewicht y ist. Bei festem c 
ist die Irrtumswahrscheinlichkeit um so kleiner, je größer 
y ist. Ihren maximalen Wert erreicht sie für y = 500 (vgl. Abb.2), 



v?(x|/i; 10A/77) 




1.1.5 Der Einfachheit halber wollen wir jetzt voraussetzen, 
daß nur n = 2 Zuckerpakete kontrolliert werden. Soll die 
Irrtumswahrscheinlichkeit dann z. B. 0,1 nicht überschreiten, 
so folgt für c 

0,1 = <f> (c | 500; — ) = 4 > (- C ^ --/2) . 

/2 10 



Hieraus erhält man 



,500-c 
1 1 



V2) 



0,9 



und 



5 . 00 p /2 = 1 ,282 

woraus sich 

c = 500 - 10 ^j- 8 - 2 = 490,93 
✓ 2 
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ergibt. Wird also das Abfüllgewicht der Zuckerpakete bean- 
standet, falls das mittlere Füllgewicht der beiden kontrol- 
lierten Pakete kleiner als 490,93 g ist, so muß ein vor- 
schriftsmäßig abfüllender Hersteller mit maximal 0,1 Wahr- 
scheinlichkeit einen Bußgeldbescheid befürchten. 



1.2 Hypothesen und Testverfahren 

1.2.1 Im oben betrachteten Beispiel kennen wir eine Menge 
von Verteilungsfunktionen, zu der die Verteilung F(x) unserer 
Meßwerte auf jeden Fall gehört. 

F (x) e { <j) ( x | y ; 1 0 ) , y > 0 } . 

Zu entscheiden ist, ob die Meßwerte die speziellere Annahme 
F(x) e { <|> (x | y ; 1 0) , y > 500 } 

widerlegen. Dazu soll vor Durchführung der Messungen fest- 
gelegt werden, bei welchen Ergebnissen die Annahme abgelehnt 
wird . 

Auch andere praktische Fragestellungen führen auf ein sta- 
tistisches Problem, das ganz allgemein so formuliert werden 
kann. Von einer interessierenden Zufallsvariablen X ist be- 
kannt, daß die Verteilungsfunktion F(x) zu einer Klasse 7 
von Verteilungen gehört. Zu einer vorgegebenen Teilmenge 
io ^ 7 wird ein Entscheidungs verfahren gesucht, das angibt, 
für welche Ergebnisse einer Stichprobe (X^ , . .., X n ) aus 

der Verteilung F (x) die Annahme 

F (x) e 



widerlegt ist und bei welchen Ergebnissen nicht. Im obigen 
Beispiel steht X für das Füllgewicht der Zuckerpakete und 
wir haben 
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T = { <(» (x| p ; 10) 



P > 0 } 



Tc. = { 4> (x| y; 10) , U > 500 } . 

1.2.2 Annahmen über die Verteilungsfunktion einer Zufalls- 
variablen werden statistische Hypothesen genannt. Ist die 
Verteilung durch die Annahmen bereits vollständig beschrie- 
ben, d. h. ist mit den Annahmen nur eine einzige Verteilungs- 
funktion verträglich, so spricht man von einer einfachen 
Hypothese , andernfalls von einer zusammengesetzten Hypothe- 
se, Im betrachteten Beispiel wäre 

F (x) = <J> (x| 500; 10) 

eine einfache Hypothese. Dagegen ist 
F (x) e { (x | y ; 1 0) , y > 500 > 

eine zusammengesetzte Hypothese. 

1 . 2>, 3 Ist eine Entscheidung der oben beschriebenen Art zu 
treffen, so sagt man, die Nullhypothese 

H q : F (x) e To 

solle geprüft bzw. getestet werden. Bei einer einfachen 
Nullhypothese schreibt man auch 

H : F(x) = F (x) . 
o o 

Besteht, wie im obigen Beispiel, die Klasse *5" der in Frage 
kommenden Verteilungen aus einer Schar von Verteilungsfunk- 
tionen, die sich nur durch die Werte ihrer Parameter unter- 
scheiden, so kann die Nullhypothese auch einfach durch die 
Angabe der Parameterwerte beschrieben werden. Für das Bei- 
spiel haben wir dann 

H : y > 500. 
o = 
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1.2.4 Vorschriften, die es gestatten, Nullhypothesen auf 
die Verträglichkeit mit Stichprobenergebnissen zu überprü- 
fen, werden Testverfahren genannt. Ein Testverfahren ist be- 
schrieben durch die Angabe einer aus der Stichprobe 
( X ^ , X 2 , . X n ) zu berechnenden Kenngröße 

U = U(X 1 , X 2 , . . . , X n ) 

- der Prüfgröße - und einer Teilmenge 

K C R 

- des Ablehnungsbereichs , auch kritischer Bereich genannt. 
Fällt die Realisation von U in den Ablehnungsbereich, so 
wird H q abgelehnt, andernfalls nicht. 

Im Beispiel in 1.1.5 hatten wir 

X 1 +X 2 

u. (X -j , X 2 ) — 2 

K = ( — ; 490,93 ). 

Dabei ist K so gewählt worden, daß die Wahrscheinlichkeit 
für eine irrtümliche Ablehnung von H q den Wert 0,1 nicht 
übersteigt . 

Die maximale Irrtumswahrscheinlichkeit eines Tests heißt 
Signifikanzniveau und wird mit a bezeichnet. Gebräuchliche 
Signifikanzniveaus sind a = 0,05 und a = 0,01. In unserem 
Beispiel hatte der Test das Signifikanzniveau a = 0,1. 



1.3 Gütefunktion 

1.3.1 In dem oben betrachteten Test haben wir X als Prüf- 
größe verwendet. Da kleine Meßwerte auf eine Nichteinhaltung 
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des vorgeschriebenen Abfüllgewichts hinweisen, wäre es eben- 
falls naheliegend, das Abfüllgewicht der Zuckerpakete dann 
zu beanstanden, wenn alle Meßwerte unter einer geeignet zu 
wählenden Schranke d bleiben, d. h. wenn gilt 

max (X 1 , X 2 , . . . , X R ) < d. 

Bei diesem Test ist die Prüfgröße gleich dem größten Meßwert 
und K = ( -» ; d ) der Ablehnungsbereich. 

Gehen wir der Einfachheit halber wieder von nur zwei Messun- 
gen aus, so gilt für die Verteilungsfunktion der Prüfgröße 
bei vorgegebenem y 

W( max (X 1 ,X 2 ) < x | p ) = W( X 1 < x, X 2 < x | p ) 

= W( X 1 < x | p )«W( X 2 < x | p ) 

= U( x|u;10 )] 2 . 

Für y > 500 nimmt die Wahrscheinlichkeit ihren größten Wert 
bei y = 500 an. Daher hat der Test das Signifikanzniveau 0,1, 
wenn für d 



0,1 



[* (d| 500; 10)] 2 = [ 4 , ( d 1 ' Q°° )] 2 



und damit 

♦ ( d io°° ) = ■ / Ö7T = 0,3162 
gilt. Wir haben also 

♦ = 0,6838 
und folglich 



d = 495,22. 
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Wird der Hersteller also mit einem Bußgeld belegt, falls bei- 
de Meßwerte kleiner sind als 495,22 g, so ist die Wahrschein- 
lichkeit für eine fälschliche Bestrafung höchstens 0,1. 

1.3.2 Wir haben zwei verschiedene Testverfahren betrachtet, 
die beide die Einhaltung des vorgeschriebenen Abfüllgewichts 
beim Signifikanzniveau 0,1 prüfen und es ließen sich noch 
weitere Testverfahren angeben. Es erhebt sich deshalb die 
Frage, ob diese Testverfahren alle gleich gut sind oder ob 
es Gründe gibt, einen bestimmten Test vorzuziehen. 

Bei vollständiger Information über y lehnen wir die Null- 
hypothese 

H q : y > 500 

immer ab, wenn y < 500 und nicht ab, wenn y >. 500 gilt. 

(Vgl. Abb. 3) 




Abb. 3: Ablehnungswahrscheinlichkeit für H q : y > 500 bei 
vollständiger Information über y 

Die Funktion a(y), die in Abhängigkeit vom tatsächlich vor- 
liegenden Wert des Parameters y die Wahrscheinlichkeit an- 
gibt, mit der die Nullhypothese abgelehnt wird, heißt Güte- 
funktion des Tests 

a ( y ) = W ( U e K | y ) . 

Die in Abb. 3 gezeichnete Funktion kann als Graph der "ide- 
alen Gütefunktion" für H q : y > 500 gedeutet werden. Da eine 
Stichprobe nur unvollständige Information über den tatsäch- 
lichen Parameterwert enthält, können die Werte der Güte- 
funktion eines Tests auf Stichprobenbasis die Idealwerte 0 
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bzw. 1 nicht erreichen. Man kann aber versuchen, Prüf große 
und Ablehnungsbereich so zu wählen, daß der Verlauf der Güte 
funktion dem der idealen Gütefunktion möglichst nahe kommt. 

1.3.3 Für die Nullhypothese 

H o : y > 500 

haben wir im obigen Beispiel für die Ablehnungswahrschein- 
lichkeit in Abhängigkeit vom mittleren Abfüllgewicht y bei 
der Prüfgröße X 

a T (ti) = *(490,93 ) 

1 /2 

und bei der Prüfgröße max (X^ , X 2 ) 
ocjjfli) = [*(495,22|p;10)j 2 

erhalten. In der folgenden Tabelle sind einige Werte der bei 
den Gütefunktionen angegeben 



y 


a z (v) 


H 

H 

Ö 


470 


0,9985 


0,9882 


480 


0,9389 


0,8761 


485 


0,7991 


0,7174 


490 


0,5523 


0,4889 


490,93 


0,5000 


0,4436 


495,22 


0,2721 


0,2500 


500 


0,1000 


0 , 1 000 


505 


0,0233 


0,0269 


510 


0,0035 


0,0049 



Damit ergibt sich für die beiden Gütefunktionen etwa der in 
Abb . 4 dargestellte Verlauf. 
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a(p) 




Abb . 4 zeigt, daß die Gütefunktion zum Test I überall der 
idealen Gütefunktion näher ist als die Gütefunktion von 
Test II. Der Test mit X ist also besser. Man kann sogar zei- 
gen, daß es bei Stichprobenumfang n = 2 keinen besseren Test 
gibt, d. h. für H q : y > 500 existiert kein Test, dessen Gü- 
tefunktion der idealen Gütefunktion überall wenigstens so 
nahe kommt, wie die Gütefunktion des angegebenen Tests mit 
X , ihr aber für mindestens einen y -Wert sogar näher kommt. 
Man vergleiche hierzu z. B. HOEL (1966), Chapter 9. 

Die in den nachfolgenden Abschnitten dargestellten Prüfver- 
fahren werden jeweils besser sein als alle anderen vernünfti- 
gerweise für die betreffende Nullhypothese in Betracht kom- 
menden Testverfahren. Auf den Nachweis hierfür müssen wir 
aber verzichten. 
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1.3.4 Es sei nun X eine beliebige Zufallsvariable, von 
deren Verteilungsfunktion bekannt ist, daß sie der Klasse 7 
angehört. 31, sei eine Teilmenge von f . Die Nullhypothese, 
die Verteilungsfunktion von X liege in , soll aufgrund 
der Stichprobe (X^ , X^ , ..., X n ) durch die Prüfgröße 
U = u(X^, X 2 , ..., X R ) und den Ablehnungsbereich K C R 
geprüft werden. Man nennt dann allgemein 

a(F) = W(U e K | F) für F e T 

die Gütefunktion dieses Tests, a (F) ist die Wahrscheinlich- 
keit, mit der die Nullhypothese bei Vorliegen der Vertei- 
lungsfunktion F abgelehnt wird. Bei der Konstruktion eines 
Tests wird man daher darauf achten, daß Prüf große und Ableh- 
nungsbereich so gewählt werden, daß die Wahrscheinlichkeiten 

a(F) , F e ^ 

möglichst klein und die Wahrscheinlichkeiten 
a(F) , Fi % 
möglichst groß sind. 

Anstelle der Gütefunktion betrachtet man häufig auch die 
Funktion 

ß (F) = 1 - a(F) , 

die angibt mit welcher Wahrscheinlichkeit die Nullhypothese 
nicht abgelehnt wird. 3(F) heißt Operationscharakteristik 
oder kurz OC-Kurve . 

Zeichnen lassen sich Gütefunktion und OC-Kurve . nur , wenn 
die Verteilungsfunktionen der Menge 7 durch Parameter be- 
schrieben werden können. In diesem Falle kann wie in 1.3.2 
das Argument der Gütefunktion durch die Parameterwerte er- 
setzt werden. 



242 




2. Hypothesen über Erwartungswerte 



2.1 Ein Erwartungswert 

2.1.1 In dem in 1.1 betrachteten Beispiel legt die Null- 
hypothese nur den unbekannten Erwartungswert der Verteilung 
fest. Im folgenden gehen wir allgemeiner auf derartige Null- 
hypothesen ein. 

Es sei X eine Zufallsvariable, deren Erwartungswert y unbe- 
kannt ist. Für eine beliebige Zahl y Q sollen die Nullhypo- 
thesen 



H o : y = u o 
H o : p 



H o : ” = y o 



beim Signifikanzniveau a geprüft werden. 



(X-j , X 2 , ..., X R ) sei eine Stichprobe aus der Verteilung 

von X . Nach den Überlegungen in 1.1 liegt es nahe, Hypo- 
thesen über den Erwartungswert von X mit der Prüfgröße X 
zu testen und den Ablehnungsbereich K unter Berücksichti- 
gung des Signifikanzniveaus so zu wählen, daß die Wahrschein- 
lichkeit, mit der eine falsche Nullhypothese abgelehnt wird, 
maximal wird. Um K so festlegen zu können, müssen wir die 
Verteilung von X kennen. Wir werden also wieder voraus- 
setzen, daß X entweder eine normalverteilte Zufallsvariab- 
le ist oder daß der Stichprobenumfang n groß ist. 
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2 

2.1.2 Sei X normalverteilt mit bekannter Varianz o . Dann 
ist das Stichprobenmittel (y ; a//n) -normalverteilt . Gemäß 
1 . 1 wird man die Nullhypothese 

H o= W > W G (1) 

ablehnen, falls das Stichprobenmittel "wesentlich kleiner" 
ist als y Q . Bei Gültigkeit von H q sind kleine Mittelwerte 
dann am wahrscheinlichsten, wenn y = y Q gilt. Folglich wird 
man die Grenze c des Ablehnungsbereichs 

K = (-»; c) 

so wählen, daß die links von c unter der Dichte cp (x | y Q ; o/ /n) 
liegende Fläche den Inhalt a hat (vgl. Abb . 5) 




Für c gilt dann 

- c_y o - 

a = <p (c | y Q ;a//n) = <f> (— - — /n) 



d. h. 



y - c _ 

*(— — /n) =1-o 

G 



d. h. 



-/n 
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d. h. 



c = y o~ z a’ a /^ 

Beim Signifikanzniveau a wird die Nullhypothese (1) also 
abgelehnt, falls das Stichprobenmittel Werte aus dem Ableh- 
nungsbereich 

K = ( - qo ; z a *a/V n ) 

annimmt . 

Entsprechend wird die Nullhypothese 

H o : y = p o (2) 

abgelehnt, wenn das beobachtete Stichprobenmittel "wesent- 
lich größer" ist als y . Für die Nullhypothese (2) erhält 
man daher einen Test zum Signifikanzniveau a, wenn H q abge- 
lehnt wird, falls das Stichprobenmittel Werte aus dem Ab- 
lehnungsbereich 

K = (y Q +z a *a/\/n ; °° ) 

annimmt . 

Die Nullhypothese 

H : y = y (3) 

o o 

wird abgelehnt, wenn das Stichprobenmittel "zu kleine" oder 
"zu große" Werte annimmt. In diesem Falle erhält man einen 
Test zum Signifikanzniveau a, wenn (3) abgelehnt wird, falls 
das Stichprobenmittel in den Ablehnungsbereich 



K = ( - co ; y Q - z^/2* o /\fn ) \j ( y Q + z^ /2 • a / \fn ; co ) 

fällt (vgl. Abb. 6) . 
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M 0 +Z a,2 a/ '^ K 



Abb. 6 



2.1.3 Häufig werden Prüfgrößen so normiert, daß die Grenzen 
der Ablehnungsbereiche den entsprechenden Tabellen direkt 
entnommen werden können. Da 



X < y - z *a//n 
o a 



gleichbedeutend ist mit 



X - y 



— /n < -z 



erhält man für die Nullhypothese 



V * £ y o 



einen Test zum Signifikanzniveau a, wenn H q abgelehnt wird, 
falls die normierte Prüfgröße 



X - 



Vn 



(4) 



in den Ablehnungsbereich 



K = (-<*>; -z ) 



fällt. 

Entsprechend ist die Nullhypothese 
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beim Signifikanzniveau a abzulehnen, wenn die Prüfgröße (4) 
Werte aus dem Ablehnungsbereich 



K 



( z „ 



) 



annimmt, während 



abgelehnt wird, wenn die Prüfgröße (4) in den Ablehnungsbe- 
reich 



K 



Z a/2 } V (Z a/2 



) 



fällt. 

2.1.4 Ganz analog gelangt man zu Testverfahren für Hypo- 
thesen über y, wenn die Varianz von X unbekannt ist. Für nor- 
malverteiltes X ist nach W 5.2.4 die Zufallsvariable 




STUDENT-t-verteilt mit n - 1 Freiheitsgraden. Daher 
lehnt man 



H : y > y 

o p = H o 



beim Signifikanzniveau a ab, wenn die normierte Prüfgröße 



X - 



(5) 



Werte aus dem Ablehnungsbereich 



K = -Vl.-a’ 
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annimint. Beim gleichen Signifikanzniveau a wird 



abgelehnt, falls die Realisation der Prüfgröße (5) in den 
Ablehnungsbereich 



K 



(t. 



n- 1 ; a ' 



00 ) 



fällt, und 



wird abgelehnt, wenn (5) Werte aus dem Ablehnungsbereich 

K = - t n-1;a/2 , V(V 1; a /2 '- 

annimmt . 



Für n = 5 und a = 0,05 erhält man z. B. als Ablehnungsberei- 
che für die drei betrachteten Nullhypothesen 

K = ( — ; -2,132) 

K = (2,132; «) 

K = (-»; -2,776) v (2,776; -) . 

Für n > 30 können in den Ablehnungsbereichen die t-Werte 
wieder durch die z-Werte der Standardnormalverteilung er- 
setzt werden. 

2.1.5 Ist die Verteilung von X unbekannt, so ist nach dem 
Zentralen Grenzwertsatz die Zufallsvariable 

L^/n 

S 
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jedenfalls für große Stichproben näherungsweise (0;1) -nor- 
malverteilt. Wie oben erhalten wir mit der normierten Prüf- 
größe 



X ~ 



Testverfahren zum Signifikanzniveau a, wenn 



( 6 ) 



abgelehnt wird, falls die Realisation von (6) in den Ableh- 
nungsbereich 



K = (-«; -z ) 

OL 

fällt, bzw. wenn die Nullhypothese 



abgelehnt wird, falls (6) Werte aus 



annimmt, bzw. wenn die Nullhypothese 



abgelehnt wird, falls die Realisation von (6) in den Ableh- 
nungsbereich 



K 



(-« 



_Z a/2>^ (Z a/2 



) 



fällt. 
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2.2 Vergleich zweier Erwartungswerte 



2.2.1 Viele praktische Probleme führen zu der Aufgabe, die 
Erwartungswerte zweier Zufallsvariablen zu vergleichen. Ein 
Fabrikant möchte etwa wissen, ob ein neu entwickelter Auto- 
reifen eine größere mittlere Lebensdauer besitzt als der 
bisher von ihm produzierte. Oder es soll überprüft werden, 
ob die durchschnittlichen Hektarerträge zweier Getreidesor- 
ten unterschiedlich sind. Oder man möchte wissen, ob das 
Schlafmittel A wirksamer ist als das Schlafmittel B. 



2.2.2 Wir greifen das zuletzt genannte Beispiel auf und be- 
zeichnen mit X und Y die Schlafdauer nach Einnahme des Prä- 
parates A bzw. B. u und u seien die Erwartungswerte von X 
x y 

und Y. Wenn Hypothesen über die Erwartungswerte von X und Y 
geprüft werden sollen, liegt es nahe, zwei verschiedene Grup- 
pen von Versuchspersonen das Schlafmittel A bzw. B einnehmen 
zu lassen und anschließend die Schlafdauer für jede Person 
zu ermitteln. Man gelangt so zu Stichproben (X^ , X 2 , . .., X m ) 
und (Y.j , Y 2 , ..., Y r ) , wobei m den Umfang der ersten und n 
den Umfang der zweiten Versuchsgruppe bezeichnet. Dabei ist 
m = n natürlich zugelassen. 



2.2.3 Da die Stichproben durch unabhängige Zufallsexperi- 
mente gewonnen werden, sind die Stichprobenmittel X und Y 
unabhängige Zufallsvariablen und es gilt 

- - - - 2 2 
var (X - Y) = var X + var Y = a x /m + cj^/n 



wobei 



o 



2 

x 



var X und 



var Y 



gesetzt wurde. Für große m und n sind nach dem Zentralen 
Grenzwertsatz X und Y und damit auch X - Y normalverteilte 
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Zufallsvariablen. Folglich ist 



X - Y - (U x - 



y y ) 




standardnormalverteilt. Da die Stichprobenvarianzen 



9 91 ^ 

= -A [ (X. - X) und S = -Ar y (Y. - Y) 

m- 1 “ i y n- 1 “ i 



2 2 

konsistente Schätzfunktionen für a und a sind, ist dann 

x y 

für große m und n auch die Stichprobenfunktion 



X - Y - (y - y ) 
x y 



/s 2 /m + S 2 /n 
/ x' y' 



standardnormalverteilt . 



2.2.4 Folglich nimmt bei Gültigkeit der Nullhypothese 



H : y = y 

o x y 



die Zuf allsvariable 



X - Y 

/ S 2 /m + S 2 /n 
v x' y' 



(D 



mit Wahrscheinlichkeit 1 - a 

j-z /0 ; z /n I an . Man wird H 
L a/2 a/2 J 

ablehnen, wenn die Prüfgröße 



Werte aus dem Intervall 
} daher beim Signifikanzniveau a 
(1) in den Ablehnungsbereich 



K 



(-°°; 



Z a/2 ) V (z a /2 



) 



fällt. 
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Da (1) für y x < p^, d. h. für p x - p^, < 0 zu kleinen Reali- 
sationen tendiert, wird man 



beim Signifikanzniveau a ablehnen, wenn die Prüfgröße (1) 
Werte aus dem Ablehnungsbereich 



(z 



annimmt. Entsprechend wird die Nullhypothese 



beim Signifikanzniveau a abgelehnt, falls die Realisation 
von (1) in den Ablehnungsbereich 



K 



fällt. 



2.2.5 Beispiel : Soll die Behauptung, Schlafmittel A sei 

wirksamer als Schlafmittel B beim Signifikanzniveau a = 0,05 
bestätigt werden, so ist die Nullhypothese 



zu prüfen. Haben die Versuchsgruppen den Umfang 50 bzw. 100 

- 2 — 

und ergeben die Versuche X = 6,9; S =1 bzw. Y = 6,6; 

2 x 
Sy = 2, so erhalten wir für die Realisation der Prüf große (1) 

6^9 - 6,6 = 1 5 

✓ 1/50 + 2/100' 



Da diese Realisation nicht in den Ablehnungsbereich 
(z o,o5 = ( 1 (645 ;oo) 
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fällt, ist die Behauptung, Schlafmittel A sei wirksamer als 
Schlafmittel B, beim Signifikanzniveau a = 0,05 nicht bestä- 
tigt . 

2.2.6 Sind X und Y normalverteilte Zufallsvariablen mit der 
gleichen Varianz, so läßt sich zeigen, daß die Zuf allsvariable 

X - Y - (y - y ) 

K Y 

/(1/m + 1/n) [(m-1 ) + (n- 1 ) S^ ] / (m+n-2 ) 

für m > 2 und n > 2 STUDENT-t-verteilt ist mit m+n-2 Frei- 
heitsgraden. Man vergleiche hierzu FISZ (1973), S. 412 ff. 

Unter diesen Voraussetzungen lassen sich also die Nullhypo- 
thesen aus 2.2.4 für die Erwartungswerte von X und Y auch 
bei kleinem m und n prüfen, wenn man die Zufallsvariable 



/(1/m + 1/n) [(m-l)S^ + (n-1 ) S^ ] / (m+n-2)' 

als Prüfgröße verwendet und in den oben angegebenen Ableh- 
nungsbereichen z durch t , 0 ersetzt. 

^ a m+n-2 ;a 



2.3 Vergleich mehrerer Erwartungswerte 

2.3.1 In vielen Fällen wird man die Erwartungswerte auch 
von mehr als zwei Variablen vergleichen wollen, etwa wenn 
geprüft werden soll, ob mehrere Medikamente gleich wirksam 
sind. Handelt es sich um den Vergleich von Erwartungswerten 
normalverteilter Zuf allsvariablen , die alle die gleiche (un- 
bekannte) Varianz besitzen, so läßt sich diese Aufgabe mit 
der Varianz analy se lösen, deren einfachster Fall hier be- 
handelt werden soll. 
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2.3.2 , X 2 / . .., X^ seien normalverteilte Zufallsvariablen 

mit den Erwartungswerten y ^ , u 2 , •••» und der Varianz o 2 . 
Gesucht wird ein Test zur Prüfung der Nullhypothese 



H o : W 1 = »2 = ••• = »V 



(X 11' X 1 2 ' 



, X 



ln. 



' (X k1' X k2 ' 



, x kn ^ seien un- 



abhängige Stichproben aus den Verteilungen von X^ , X 2 ,...,X 
Wenn H q richtig ist, haben die Zufallsvariablen X^ , X 2 , . , 
alle die gleiche Normalverteilung und wir können 



(X 1 1 ' X 1 2 * 



■ / X 



ln, 



2 1 1 






als Stichprobe aus dieser Verteilung auffassen. Wir nennen 

sie die Gesamtstichprobe und (X^ , X^ 2 , ..., X^ n ) die i-te 

i 

Teilstichprobe, i = 1, 2, ..., k. Bezeichnen wir den Umfang 
der Gesamtstichprobe mit n, so gilt 



£ n . 
i 1 



und wir erhalten für das Stichprobenmittel und die Stichpro- 
benvarianz der Gesamtstichprobe 



i K 1 

X = 1 I Ix,. 

n i=1 j=1 12 

- k n i 

S 2 = _L y y (x. . - 

n “ 1 i=i j-i 13 



X) 2 . 



Für i = 1 , 2 , . . . , k ist 



£.= - l x. 

i n . L . i 



j = 1 



das Stichprobenmittel und 
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x ** 





Die Varianz der Gesamtstichprobe läßt sich also zerlegen in 
einen Anteil, der nur von den Teilstichprobenvarianzen ab- 
hängt und in einen Anteil, der nur von den Abweichungsqua- 
draten der Teilstichprobenmittel vom Gesamtstichprobenmittel 
abhängt. Während 

l (n- 1 ) S ? 

von den Erwartungswerten y^, ..., y^ nicht beein- 

flußt wird, wird 
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I n i< x i - x > 2 



umso größer aus fallen, je stärker sich die Erwartungswerte 
voneinander unterscheiden. Große Werte der Zufallsvariablen 

l V^i " x)2 _ I n. ( Xj - X ) 2 

I (n ± - 1)S 2 I I (x ij - x i> 2 

deuten also darauf hin, daß die Erwartungswerte verschieden 
sind. 



2.3.3 Ist die Nullhypothese richtig, so haben die Zufalls- 
variablen alle die gleiche Normalverteilung. Da sie auch 

unabhängig sind, läßt sich zeigen, daß die Zufallsvariablen 



n. (X. - 
1 i 



X) 2 



und 



2 

unabhängig und x -verteilt sind mit k - 1 bzw. n - k Frei- 
heitsgraden. (Man vergleiche hierzu z. B. FISZ (1973), 

S. 611 ff.). Nach W 5.2.5 ist dann die Zufallsvariable 



(n - k) y n. (X. - X) 2 

r — ö (D 

(k - 1) [ I (x ±j - x.) 2 



F-verteilt mit k - 1 und n - k Freiheitsgraden. Man wird da- 
her H q beim Signifikanzniveau a ab lehnen, wenn die Prüfgröße 
(1) einen Wert annimmt, der in den Ablehnungsbereich 



fällt. 

2.3.4 Beispiel : Führen 3 Teilstichproben zu folgenden Rea- 
lisationen 
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D 


x u 


x 2 j 


*3j 


1 


21 


30 


25 


2 


22 


29 


27 


3 


26 


! 28 





so hat man 



x 1 = 23 


- 1 (x ij" 


x r 


= 


14 


x 2 = 29 


' 1 (X 2 j- 


x 2 : 


, 2 = 


2 


X 3 = 26 


' E(X 3j- 


X 3 J 


1 2 = 


2 


x = 26 


, ll (x. 


x. ) 


2 


1 8 




1 : 


1 







und für die Prüfgröße folgt 

(n-k) Zn.(x.-x ) 2 8-3 3 (23-26) 2 +3 (29-26 ) 2 +2 (26-26 ) 2 

(k-1)EI(x ij -x i ) 2 3-1 18 

= 7,5. 



Beim Signifikanzniveau a = 0,05 fällt diese Prüfgröße in den 
Ablehnungsbereich 



K 



( F 



2 



; 5 ;o,o5 



(5,79;-) . 



Die Nullhypothese ist also widerlegt. 



3. Hypothesen über Wahrscheinlichkeiten 
und Massefunktionen 

3.1 Eine Wahrscheinlichkeit 

3.1.1 In vielen Fällen sind Hypothesen über Wahrscheinlich- 
keiten zu prüfen. Beispielsweise interessiert die Frage, ob 
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Knaben- und Mädchengeburten gleichwahrscheinlich sind. 



Die Überlegungen zur Konstruktion von Tests über Erwartungs- 
werte lassen sich sinngemäß auf Wahrscheinlichkeiten über- 
tragen. In S 1.3.7' wurde eine unbekannte Wahrscheinlichkeit 
erwartungstreu durch den Stichprobenanteilswert P geschätzt. 
Es ist daher naheliegend, den Stichprobenanteilswert in nor- 
mierter Form als Prüf große zu verwenden. 

3.1.2 Für große n ist die Zufallsvariable 

■ — -- /n (1) 

/e (1-e) 

nach dem Zentralen Grenzwertsatz näherungsweise standard- 
normalverteilt (vgl. W 5.3.7). Soll für eine beliebige Zahl 
0 Q mit 0 < 0 Q < 1 z. B. die Nullhypothese 



geprüft werden, so ist bei Gültigkeit von H q die Zufalls- 
variable 



P - 0. 



° -/n 



/e o (1 - 0 o> 



( 2 ) 



standardnormalverteilt. Man wird also H Q beim Signifikanz- 
niveau a ab lehnen, falls (2) Werte aus dem Ablehnungsbereich 

K = “ z a /2 ) V (z a/2 ; 

annimmt . 

Da die Zufallsvariable (2) bei Gültigkeit von 

H : 6 1 
o = o 

zu kleinen Realisationen tendiert, wird man diese Nullhypo- 
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these beim Signifikanzniveau a ablehnen, wenn der Wert von 
(2) in den Ablehnungsbereich 



K 



(z 



) 



fällt. 

Entsprechend lehnt man die Nullhypothese 

H : 0 > 6 
o = o 

ab, wenn die Realisation von (2) im Ablehnungsbereich 



liegt . 

3.1.3 Beispiel : Wird eine Münze 100 mal geworfen und er- 
scheint dabei 60 mal "Kopf", so ist die Hypothese, die Wahr- 
scheinlichkeit für "Kopf" sei 0,5 , beim Signifikanzniveau 
0,05 wegen 



2jl1/ioO = 2 

/0 , 5 • 0 , 5 

und 

K = (-» ; -1 ,96) v (1 ,96; <») 
widerlegt . 

3.1.4 Da die Zufalls variable (1) für große n standardnor- 
malverteilt ist, ist der Stichprobenanteilswert P für große n 

( 0 ; / 0 ( 1 - 0 )/n) - normalverteilt . 

Die Verteilung von P ist also durch die unbekannte Wahr- 
scheinlichkeit 0 vollständig bestimmt. Daher ist auch die 
Gütefunktion für Tests über Wahrscheinlichkeiten allein eine 
Funktion von 0 . 
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Nehmen wir an, die Nullhypothese 



H Q : 6 < 0,2 

solle durch eine Stichprobe vom Umfang 100 beim Signifikanz- 
niveau 0,05 geprüft werden. Nach 3.1.2 lehnen wir H q ab, 
wenn gilt 

P ~ 0,2 /TÖÖ > z = 1 ,645. 

/ 0 , 2 • 0,8 °'° 5 

Das ist gleichbedeutend mit 

P > 0,2658. 

Dann ist bei beliebigem Wert von 0 die Ablehnungswahrschein- 
lichkeit für H gleich dem Inhalt der Fläche unter 
o 3 

cp(x | 0 ; /e ( 1 -0 ) /n) , die rechts von 0,2658 liegt, d. h. es gilt 
a ( 0 ) = 1 - <f> (0, 2658 | 6 ; /0 (1-0)/n) 




Abb. 7 



Wie Abb. 7 zeigt, wird die Fläche unter der Dichtefunktion, 
die über dem Ablehnungsbereich liegt, um so größer, je nä- 
her 0 bei 1 liegt ^ ^ . Die Werte der Gütefunktion wachsen 



1) Dies gilt, obwohl die Dichtefunktion cp (x| 0 ; /0 (1-0)/n) 
um so flacher verläuft, je weniger sich 0 von 0,5 unter- 
scheidet. Denn bei festem n nimmt die Varianz 0(1-0)/n 
ihren größten Wert für 0=0,5 an (vgl. W 4.1.5). 
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also monoton. Es ist a (O) =0 und a ( 1 ) = 1. Weiter gilt 

a (0,2) =0,05 

a (0,2658) =0,5. 

Für e = 0,2 ist also die Ablehnungswahrscheinlichkeit für H q 
gleich dem Signifikanzniveau, was den Überlegungen bei der 
Konstruktion des Ablehnungsbereichs entspricht. Dagegen liegt 
für 0 = 0,2658 genau die Hälfte der Fläche unter der Dichte- 
funktion über dem Ablehnungsbereich. Die Wahrscheinlichkeit, 
daß P in den Ablehnungsbereich fällt, ist dann 0,5 . Damit 
hat die Gütefunktion unseres Tests etwa folgenden Verlauf 
(vgl. Abb . 8) 
cx(0) 




3.2 Vergleich zweier Wahrscheinlichkeiten 

3.2.1 In manchen Fällen möchte man die Wahrscheinlichkeiten 
von zwei zufälligen Ereignissen A und B vergleichen, etwa 
wenn man wissen möchte, ob bei Einnahme eines Medikamentes 
Nebenwirkungen mit geringerer Wahrscheinlichkeit eintreten 
als bei Einnahme eines anderen. 

Wir bezeichnen mit X die Zufallsvariable, die den Wert 1 bzw. 
0 annimmt, je nachdem, ob bei der Durchführung des zugrunde- 
liegenden Zufallsexperimentes A oder Ä eintritt. Entsprechend 
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sei Y die Zufallsvariable, die den Wert 1 bzw. 0 annimmt, 

wenn B bzw. B eintritt. Sind dann (X 1 , X~ , X ) und 

1 2 m 

( Y i , Y^, .../ Y n ) unabhängige Stichproben aus den Vertei- 
lungen von X bzw. Y , so sind 



= - X. 
TC[ ff 1 



und 



i n 

1 1 

n L> 



Y. 



die Stichprobenanteilswerte und es gilt 



EP = 6 , var P = 0 (1-0 ) /m 

X X ' X X x' ' 



EP = 6 , var P = 0 (1-0 ) /n . 

y y y y y 



Dabei ist 



0 v = W (A) und 0 = W (B ) 

x y 

gesetzt worden. Da P x und P^ unabhängige Zufallsvariablen 
sind, gilt 



E(P x 



P ) = 
T 



0 



Y 



var (P x - P y ) = e x (1-0 x )/m + e y (1-0 y )/n. 



Für große Stichprobenumf änge m und n sind die Stichproben- 
anteilswerte P und P nach dem Zentralen Grenzwertsatz nä- 
x y 

herungsweise normalverteilt und folglich auch die Differenz 
p x - P y . Die Zufallsvariable 



P - P - E (P 
x y x 



P y ) 



/var (P - P ) 
x y 



P - P - 

-X Y_ 



(0 - 0 ) 
x y 



/0 x (1 " e x )/m + e y (1 " e y )/n 



ist dann standardnormalverteilt. Da 



p x (1 - p x ) ^d P y (1 - P y ) 



konsistente Schätzfunktionen für 0 (1 - 0 ) und 0 (1 - 0 ) 

xx y y 
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sind, ist auch die Zufallsvariable 



P - P - (6 - 0 ) 

x y x y 

/P X ( 1 _P X )/m + P y ( 1 _p y )/n 



für große m und n standardnormalverteilt. 



3.2.2 Für große Stichprobenumfänge und = 0^ ist die Zu- 
fallsvariable 



P - P 

x Y 



/P x (1_P x )/m + P y (1 " P y )/n 



( 1 ) 



standardnormalverteilt. Man erhält also einen Test für die 
Nullhypothese 



H : 0 =0 

o x y 



zum Signifikanzniveau a , wenn man (1) als Prüfgröße verwen- 
det und II ak 
o 

nungsbereich 



det und II Q ablehnt, wenn die Prüfgröße Werte aus dem Ableh- 



K = ’ Z a/2 ) V <V2 ; 



annimmt. Entsprechend ist beim Signifikanzniveau a 



H : 0 <0 

o x = y 



abzulehnen, wenn die Prüf große (1) in den Ablehnungsbereich 



K = ( z ; » ) 



fällt, und die Nullhypothese 



H : 0 >0 

o x = y 



263 




falls die Realisation von (1) im Ablehnungsbereich 



liegt . 



3.3 x 2 -Anpassungstest 

3.3.1 Wir wollen uns nun mit dem Testen von Hypothesen über 
Verteilungen beschäftigen. 

X sei eine diskrete Zufallsvariable mit den Ausprägungen 
x>| , x 2 • •••/ x j und der Massefunktion f (x) . Es soll die 
Nullhypothese 

f f (x 1 ) = 0 1 

f(x 2 ) = 0 2 

V * ; 

V f(x x ) = 0J 

getestet werden, wobei 0^ positive Zahlen mit Z0^ = 1 sind. 
Verfahren zur Prüfung von Hypothesen, die die Masse- 
funktion einer Zufallsvariablen betreffen, werden Anpassungs- 
tests genannt. 

3.3.2 ( X ^ , X 2 , .../ X n ) sei eine Stichprobe aus der Vertei- 
lung von X. Für i = 1, 2, ..., I bezeichnen wir mit n.^ die 
Zufallsvariable , die für die Realisationen von (X^ ,X 2 , . . . ,X n ) 
angibt, wie oft die Ausprägung x^ auftritt. Es gilt also 

I 

Zn. = n . 
i 1 

Ist H q richtig, so ist n0^ der Erwartungswert von n^ Dann 
werden also die Realisationen von 
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|n i - n8 i | 



und damit auch die der Zufallsvariablen 



I 

I 



(n ± 



n6 i ) ‘ 



ne . 



( 1 ) 



relativ klein ausfallen. Man kann nun zeigen, daß (1) bei 

2 

Gültigkeit von H q näherungsweise X -verteilt ist mit I - 1 
Freiheitsgraden. (Vgl. dazu z. B. FISZ (1973), S. 507 ff.). 
Die Approximation ist zulässig, wenn gilt 

ne i > 5 für i = 1, 2, ..., I. 

Man verwendet daher (1) als Prüf große und lehnt H q beim Si- 
gnifikanzniveau a ab, wenn die Prüfgröße (1) Werte aus dem 
Ablehnungsbereich 



K 



(X 



I- 1 ; ot ' 



00 ) 



annimmt . 



3.3.3 Beispiel*. Es sei die Echtheit eines Würfels beim Si- 
gnifikanzniveau 0,01 zu überprüfen. Ein Würfel wird als echt 
bezeichnet, wenn die beim Ausspielen auftretende Augenzahl 
die Massefunktion 

I 1/6 für x = 1 , 2 , . . . , 6 

f (x) ^ o sonst 

besitzt. Zu prüfen ist also 

H q : f (i) = 1/6 für i = 1, 2, ..., 6. 

Die bei einer Stichprobe vom Umfang 120 für die Augenzahlen 
beobachteten Häufigkeiten entnimmt man der folgenden Tabelle, 
die auch der Berechnung der Prüf große dient. 
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i 


n . 
l 


ne. 


(n.-ne.) 2 


(n i -n0 i ) 


ne. 


1 


1 1 


20 


81 


4,05 


2 


29 


20 


81 


4,05 


3 


26 


20 


36 


1 ,80 


4 


15 


20 


25 


1 ,25 


5 


27 


20 


49 


2,45 


6 


12 


20 


64 


3,20 


l 


1 20 


120 




16,80 



2 

Da die Prüfgröße x -verteilt ist mit 6-1=5 Freiheitsgra- 
den, erhält man für den Ablehnungsbereich 

K = ( Ht 0,01 ' “ ) = ( 15.086 ; - ) . 

Da der Wert der Prüfgröße im Ablehnungsbereich liegt, ist 
H q abzulehnen, d. h. der Würfel ist als verfälscht zu be- 
trachten. 

3.3.4 Wir wollen zeigen, wie sich eine Hypothese 
H Q : F (x) = F Q (x) 

über die unbekannte Verteilungsfunktion F(x) einer stetigen 
Zuf allsvariablen X prüfen läßt. Dabei wird mit F (x) die 
hypothetische Verteilungsfunktion bezeichnet. 

Wir zerlegen die x-Achse in I Intervalle 

-oo < x < x^ , x^ < x < x 2 , ... , x i-i < x < « 

und definieren eine Zufallsvariable Y: Y soll den Wert i an- 
nehmen, falls X in das i-te Intervall fällt (i = 1, 2, ...,I). 
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Dann ist Y eine diskrete Zufallsvariable, und für die Masse- 
funktion g(y) von Y haben wir 

g(1) = W ( < X < x^) = F (x^ ) 

g(i) = W(x i _ 1 < X < x i ) = F(x i ) - F(x i _ 1 ) für i = 2, 3, 

. . . , I - 1 

g ( I ) = W(x I _ 1 < X < ») = 1 - F(x I _ 1 ). 

Wenn H q richtig ist, gilt dann 

g (i) = 0 i für i = 1 , 2 , . . . , I 

mit 



F o (x i> - F o (x i-1 ] 



e i = 1 - F o (x I-1>- 



Man wird daher H q als widerlegt betrachten, wenn die Stich- 
probenwerte beim vorgegebenen Signifikanzniveau die gröbere 
Nullhypothese 



f gd) = 6 1 

I 

H o : \ 9 (i) = e i 



V g(D = Sj 



widerlegen . 
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Man nennt eine Vergröberung von H q , weil aus H q die Be- 
hauptung folgt, aber nicht umgekehrt. ist vielmehr auch 

für viele von F q verschiedene Verteilungsfunktionen richtig. 
Zerlegt man die x-Achse in die beiden Intervalle 

-oo < x < 0 und 0 < x < 00 , 



so ist 



H*: g ( 1 ) = g (2) = 0,5 

z. B. für alle stetigen Verteilungsfunktionen richtig, deren 
Dichten zu x = 0 symmetrisch sind. Offensichtlich ist H Q 
um so schwerer zu widerlegen, je stärker H q vergröbert wird. 

3.3.5 Beispiel : Für die 50 Zahlen der folgenden Tabelle sei 
bei einem Signifikanzniveau von a = 0,01 zu prüfen, ob sie 
als Realisationen einer standardnormalverteilten Zufalls- 



variablen zu 


betrachten 


sind. 






0,3902 


1,3740 


0,4188 


0,3225 


-1 ,3372 


1 ,2525 


-0,1645 


-0,0544 


0,0654 


-0, 2343 


-0,3299 


-1 ,8492 


-1,1612 


-0,0376 


1,6530 


-0,8881 


-1 ,8488 


-1 ,2672 


-0,3376 


-0,6674 


-0,2093 


0,4983 


-0,5532 


0,4217 


0,9449 


-0,1982 


0,8458 


2,2938 


0,0220 


1 ,9622 


1 ,1923 


-0,2864 


1,8976 


1 ,8764 


0,4833 


-0,0545 


0,9744 


-1,1246 


1,2913 


-1 ,9137 


0,7632 


-0,5735 


-0,4982 


-1 ,6072 


1 ,0651 


-0,5397 


1 ,3228 


1 ,0482 


1 ,1929 


-0,5395 



Bezeichnen wir mit F(x) die Verteilung, aus der die Reali- 
sationen stammen, so ist also die Nullhypothese 

H q : F (x) = <f> (x) 

zu prüfen. Zerlegen wir die x-Achse in die fünf Intervalle 
(-oo ; -0 ,84] , (-0 , 84 ; -0 ,2 5] , (~0,25;0,25] , (0,25;0,84] , (0,84;«) 
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so ergibt sich als vergröberte Nullhypothese 



f gd> = 


00 

0 

1 

-e- 

II 

CD 


= 0,2005 




LD 

CM 

0 

1 

-©- 

II 

■ CM 
CD 


00 

O 

O 

CM 

o 

II 

00 

0 

1 

-©- 

1 


j 9(3) = 


e 3 = <P (+0,25) 


- 4) (-0,25) = 0,1974 


' g(4) = 


e ^ = <p (+0 , 84 ) 


- 4> (+0,25) = 0,2008 


\g(5) = 


0 5 = 1 - 4> (+0, 


, 84 ) = 0,2005 


offenbar 


n • 6 ^ = 50« 6 ^ 


> 5 für i = 1 , 2 , 



und damit die Voraussetzung zur Anwendung des X 
tests gegeben. 



-Anpassungs- 



Die Anzahl der Realisationen im i-ten Intervall sowie die 
Berechnung der Realisation der Prüfgröße ist der folgenden 
Tabelle zu entnehmen 



Intervall 


n . 
i 




( v n 9 i > 2 


n6 i 


ne. 


1 


9 


10,025 


0,1048 


2 


9 


10,040 


0,1077 


3 


9 


9,870 


0,0767 


4 


7 


10,040 


0,9205 


5 


16 


10,025 


3,5612 


E 


50 




4,7709 



Bei einem Signifikanzniveau a = 0,01 ergibt sich für eine 

2 

mit 5-1=4 Freiheitsgraden X -verteilte Prüfgröße 
der Ablehnungsbereich 

K = ( 1 3,277 ; «> ) . 



Da die Prüfgröße den Wert 4,7709 hat, ist die Nullhypothese 
nicht zu verwerfen. Der Hypothese, es handele sich um Reali- 
sationen einer standardnormalverteilten Zufallsvariablen, 
kann also nicht widersprochen werden. 
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3.4 x 2 -Unabhängigkeitstest 



3.4.1 Wir betrachten zwei diskrete Zufallsvariablen X und Y 
mit den Ausprägungen x 1 , x 2 , . .., x 1 bzw. y.j, y 2 , •••’ Yjr 
so daß sich die Ausprägungskombinationen (x^ f y^) mit i = 1, 

2, .../ I und j = 1, 2, . .., J ergeben. Bezeichnen wir die 
Massefunktionen von X und Y mit f (x) bzw. g(y), so sind X 
und Y bekanntlich unabhängig, wenn für die gemeinsame Masse- 
funktion h(x,y) die Beziehung 

h (x,y ) = f (x) *g (y) 
gilt (vgl . W 2.4.3). 

Wir formulieren deshalb zur Prüfung der Unabhängigkeit von 
X und Y die Hypothese 

H q : h (x,y ) = f (x) • g (y ) . 

3.4.2 (X v X 2 , ..., X n ) und (Y v Y 2 , ..., Y R ) seien ver- 

bundene Stichproben aus den Verteilungen von X und Y. n^ 
sei die Anzahl der Realisationen der Ausprägungskombination 
( x j_,Yj) und n ± bzw. n ^ die Anzahl der Realisationen x ± bzw. 
v.. Diese Anzahlen sind in der folgenden Tabelle, die man 
Kontingenzta.be Ile nennt, zusammengestellt. 
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Die Anteilswerte n^/n, /n und n ^/n sind Zufallsvariablen 
mit den Erwartungswerten h(x^,yj), fCx^) und gCy^). 

Trifft H zu, so werden die Realisationen von 

o ' 




und daher auch die der Zufallsvariablen 



U 




n . n 
(n. . — 

2 _ 



. 2 
■i) 



klein sein 



Nun läßt sich zeigen (vgl. z. B. FISZ (1973), S. 532), daß 

U bei Gültigkeit von H für 
3 o 

n n , 

; >5 (i = 1, 2, I; j = 1, 2, ..., J) 

2 

näherungsweise X -verteilt ist mit (1—1 ) • (J— 1 ) Freiheitsgra- 
den. Betrachten wir U als Prüfgröße, so ist also H q beim Si- 
gnifikanzniveau a abzulehnen, wenn die Realisation von U in 
den Ablehnungsbereich 

K = (X (1-1 ) • (J-1 ) ;a ; 



fällt. 



^ ^ Insbesondere wenn die Anzahl der Ausprägungen von X und 
Y groß ist, bietet die Berechnung von U nach 

2 

” - I I ;r¥- ' ' 1 

1 . .] 

wesentliche Rechenvorteile. 
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Da sich als Realisation von U die Zahl 17,1295 ergibt und 



K (X (2-1 ) • (3-1 ) ;0,01 ; 



(9,210; ») 



der Ablehnungsbereich ist, ist H q zu verwerfen, d. h. X und Y 
sind als abhängig zu betrachten. 



4. Aufgaben 

4.1 Kann aufgrund der in Aufgabe S 3.1 angegebenen Beobach- 
tungen geschlossen werden, daß für die mittlere Dicke y der 
Plättchen 

a) y =j= 3,03 

b) y < 3,175 

c) y > 3,0 

gilt? Legen Sie ein Signifikanzniveau von 5% (1%) zugrunde. 

Lösung : 

Für das arithmetische Mittel und die Varianz der 10 Messungen 
hatten wir folgende Werte erhalten 

x = 3,1 ; s 2 = 0,009. 

Nach Voraussetzung ist die Dicke der Plättchen normalver- 
teilt mit Erwartungswert y . Folglich 




für y = y Q STUDENT-t-verteilt . 
a) Die Hypothese 
H q : y = 3,03 
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ist beim Signifikanzniveau a widerlegt, wenn der Wert der 
Prüf große 



3> - 1 . ~- 3 ' 03 yjö = 2,3 

/0,009 

in den Ablehnungsbereich 

K a = “ t 9;a/2 ) \J (t 9;a/2 ; 

fällt. Es gilt 

K 0,05 = { ~°° ; -2,262) ^ (2,262; ») 

K n.m = (_00; “3,250)^(3,250; ») . 

Die Prüfgröße fällt also für a = 0,05 in den Ablehnungsbe- 
reich, nicht aber für a = 0,01 . Es kann also behauptet 
werden, es gelte y =|= 3,03 , wenn ein Signifikanzniveau von 
5 % zugrundegelegt wird. Bei einem Signifikanzniveau von 1 % 
ist das nicht möglich. 

b) Man entscheidet sich für die Hypothese y < 3,175, wenn 
die Nullhypothese 

H q : y > 3,175 

abgelehnt wird. Das ist beim Signifikanzniveau a der Fall, 
wenn der Wert der Prüfgröße 

^ - - ■■ 3 ' 175 m = - 2,5 

/ 0 , 009 

in den Ablehnungsbereich 

K a = - t 9;a ) 

fällt. Es gilt 

K 0,05 = ( “°° 7 _1 ' 833 ) und K 0 ,01 = “ 2 f 82 1 ) • 

Folglich wird H q beim Signifikanzniveau 5 % abgelehnt, nicht 
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aber beim Signifikanzniveau 1 %. Mit einer Irrtumswahrschein- 
lichkeit von 5 % kann also behauptet werden, es gelte y<3,175. 
Mit 1 % Irrtumswahrscheinlichkeit ist das nicht möglich. 

c) Die Hypothese y > 3,0 ist bestätigt, wenn die Nullhypo- 
these 



H o : P < 3,0 

abgelehnt wird. Das ist beim Signifikanzniveau a der Fall, 
wenn der Wert der Prüfgröße 

■ 3 ^ ~ 3 '° /iö = 3,3 
/0, 009 

in den Ablehnungsbereich 



fällt. Es gilt 

K ons = (1,833; ») und = (2,821; ») . 

Also fällt die Prüfgröße in beide Ablehnungsbereiche, die 
Nullhypothese wird in beiden Fällen abgelehnt. Folglich kann 
sowohl beim Signifikanzniveau 5 % als auch beim Signifikanz- 
niveau 1 % behauptet werden, es gelte y > 3,0. 



4.2 Um die Wirksamkeit von Lehrmethoden zu prüfen, wurden 
20 zufällig ausgewählte Schüler in drei Gruppen zusammenge- 
faßt und nach drei verschiedenen Lehrmethoden unterrichtet. 
Die Leistungen der 20 Schüler wurden nach einem Jahr durch 
eine Klausur überprüft. Dabei erzielten die einzelnen Schü- 
ler folgende Punktzahlen 
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Punktzahlen nach Lehrmethode 




Kann bei einem Signifikanzniveau von 5 % aufgrund der Klau- 
surergebnisse auf einen Zusammenhang zwischen Unterrichts- 
methode und der gezeigten Leistung geschlossen werden, wenn 
man davon ausgeht, daß die Punktzahl eine normalverteilte 
Zufallsvariable ist und die verschiedenen Lehrmethoden die 
Streuung der Punktzahl nicht beeinflussen? 

Lösung : Auf eine unterschiedliche Wirksamkeit der drei Lehr- 
methoden kann geschlossen werden, wenn die Nullhypothese 

V y 1 = y 2 = y 3 

abgelehnt werden kann. Das ist beim Signifikanzniveau 5 % 

der Fall, wenn gilt 

_ “2 
n-k l n ± (x i - x) 

k^T l ( Xij - 5 ± ) 2 > F k-1;n-k; 0,05 . 

Um den Wert der Prüf große zu ermitteln, berechnen wir zu- 
nächst die Mittelwerte x^ (i = 1, 2, 3) und x. 



j 


x ij 


x 2j 


x 3j 


1 


8 


20 


19 


2 


18 


19 


12 


3 


13 


20 


9 


4 


12 


17 


17 


5 


14 


19 


16 


6 






18 


7 






10 


8 






14 


9 






17 


10 






18 


Z 


65 


95 


150 
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erhalten wir als Wert der Prüfgröße 



n-k 

k-1 



I n i ( x i “ x ) 2 

I (X..-X .) 2 



20-3 , 95 
3-1 *172 



4,69 . 



Wegen 



F 2 ; 1 7 ; o ,o5 



3,59 



ist die Prüfgröße signifikant, H q also widerlegt. Bei 
einem Signifikanzniveau von 5 % kann aufgrund des Klausur- 
ergebnisses behauptet werden, daß wenigstens zwei der drei 
Lehrmethoden verschieden wirksam sind. 



4.3 Man vermutet, daß die mit den Entfernungsmessern A und B 
ermittelten Meßwerte systematische Fehler aufweisen. Ins- 
besondere besteht der Verdacht, daß Entfernungen mit Ge- 
rät A zu kurz gemessen werden. Um diese Vermutungen zu 
prüfen, wird dieselbe Entfernung mit beiden Geräten und 
zusätzlich mit einem geeichten Entfernungsmesser C wieder- 
holt gemessen. Es ergibt sich 



Gerät 


gemessene Entfernung in cm 


A 


996 


999 


1002 


B 


994 


997 


1000 


C 


999 


1002 


1005 1006 



Wir gehen davon aus, daß die zufälligen Meßfehler bei allen 
Geräten normalverteilt sind und die gleiche Varianz besit- 
zen. 

Bestätigen die Messungen die Vermutung, 
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a) Gerät A messe Entfernungen zu kurz ( a = 0,05)? 

b) daß die Meßwerte zumindest eines der Geräte A oder B 
systematische Fehler aufweisen ( a = 0,05)? 

Lösung : 

Aus den angegebenen Meßwerten ergibt sich (vergl. 2.3.2) 

x, = 999 
A 

x ß = 997 
x c = 1003 

x = Jq [3-999 + 3-997 + 4-1003] 

Z n ± ( x ± -x) 2 = 3 • 1 2 + 3-3 2 + 4-3 2 

2s 2 = 3 2 + 0 2 + 3 2 = 18 
A 

2 2 2 2 
2s_. ^ = 3 + 0 Z + 3 Z = 18 

B 

3s c 2 = 4 2 + 1 2 + 2 2 + 3 2 = 30 

ZZ (x. .-x.) 2 = 18 + 18 + 30 = 66 
13 i 

9s 2 = ZZ (x ij -x i ) 2 + Z n ± (x i -x) 2 



= 1000 
= 66 



= 66 + 66 = 132 . 



a) Zu prüfen ist die Nullhypothese 



Da die Voraussetzungen des in 2.2.6 beschriebenen Tests er- 
füllt sind, berechnen wir den Wert der Prüfgröße 2.2.6 (2). 
Wir erhalten 



X C " X A 

(m-1 ) s A 2 + (n-1 ) s c 2 ' 

m + n - 2 



1003 - 999 
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Da der Wert der Prüfgröße nicht in den Ablehnungsbereich 

K = o. “ ) = (t q .„ *) = (2,015; ~ ) 

m+n-2;a 5;o,o5 ' 

fällt, kann beim Signifikanzniveau 5 % nicht behauptet 
werden, daß das Gerät A Entfernungen zu kurz messe. 

b) Da sich durch Prüfen der Nullhypothese 



H o : y A = P B 



gleichartige Fehler der Geräte A und B nicht aufdecken 
lassen, prüfen wir die Nullhypothese 



H : u _ = u = u . 
o A P B 



Die Voraussetzungen für Durchführung der Varianzanalyse 
sind erfüllt. Für die Prüf große ergibt sich der Wert 



, In, (x, — x) 
n-k 11 ' 

k- 1 _ . “ x 2 

IZ (x ij- x i> 



10-3 66 
3-1 66 



= 3,5 



Da die Prüfgröße nicht in den Ablehnungsbereich 



K = (F 



k- 1 ; n-k ; a ' 



2 ; 7 ; o , o 5 ; 



(4,74; • ) 



fällt, kann aufgrund der Messungen nicht auf systematische 
Fehler bei den Geräten A und B geschlossen werden. 
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4.4 Es wird vermutet, daß die Autoreifen der Marken A und B 
eine unterschiedliche Lebensdauer besitzen. 140 zufällig 
ausgewählte Reifen der Marke A weisen eine mittlere Le- 
bensdauer von 40 100 km bei einer Standardabweichung von 
4 200 km auf. Für 310 Reifen einer Marke B wird eine 
mittlere Lebensdauer von 41 200 km bei einer Standardab- 
weichung von 6 200 km festgestellt. Bestätigt dieses Er- 
gebnis die ursprüngliche Vermutung? (Signifikanzniveau 5 %) 



Lösung : 

Wir bezeichnen die mittlere Lebensdauer der Reifen der 
beiden Marken A und B mit und y ß . Die Vermutung 

y A ^ y B ist bestätigt, wenn die Nullhypothese 



H 0 : P A = y B 



abgelehnt werden kann. Das ist beim Signifikanzniveau 5 
der Fall, da 



X A “ X B 



B 

n^ 



40 100 - 41 200 



4200 2 , 6200 2 
310 



140 



- 1 100 



/1 26 000 + 124 000 



= - 2,2 



im Ablehnungsbereich 



K = - z o,o25 ) ^ (z o,o25'” ) = -1.96) vn-96;oo) 
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liegt. Mit einer Irrtumswahrscheinlichkeit von 5 % kann 
behauptet werden, daß die Reifen der Marken A und B eine 
unterschiedliche Lebensdauer besitzen. 



4.5 Man spielt einen Würfel 125-mal aus und erhält folgen- 
de Häufigkeitstabelle 



Augen zahl 


1 


2 


3 


4 


5 


6 


Häufigkeit 


15 


20 


25 


10 


25 


30 



a) Bestimmen Sie ein Konfidenzintervall zur Konf idenzzahl 
95,44 % für die Wahrscheinlichkeit, mit der beim ein- 
maligen Ausspielen des Würfels eine Sechs auftritt. 

b) Widerlegt die obige Häufigkeitstabelle bei einem Sig- 
nifikanzniveau von 4,56 % die Behauptung, die Wahr- 
scheinlichkeit für das Auftreten einer Sechs sei -1 ? 

c) Kann aus der obigen Häufigkeitstabelle bei einem Sig- 
nifikanzniveau von 1 % geschlossen werden, daß die 
mittlere Augenzahl größer ist als 3,5? 



Lösung : 

a) Bei 125 Ausspielungen eines Würfels ist die relative 
Häufigkeit P , mit der die Augehzahl Sechs beobachtet wird, 
nach dem Zentralen Grenzwertsatz näherungsweise normalver- 
teilt. Folglich ist das Intervall 



P - z 



a/2 



P (1-P) 
n 



P + z 



a/2 



P(1-P) 



ein Konfidenzintervall zur Konf idenzzahl 1 - a für die 
unbekannte Wahrscheinlichkeit 0 , mit der beim einmaligen 
Werfen eine Sechs auftritt. Für die Konf idenzzahl 
1 - a = 0,9544 , also 1 - a/2 = 0,9772 , entnimmt 
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man der Tabelle der Normalverteilung den Wert 



z 



a/2 



2,0 . 



Mit den beobachteten Werten ergibt sich dann 



/ p ( . 1 -p) 

Z a/2 \J n 



Folglich ist das Intervall 
[0,1636 ; 0,3164] 



30-95 1 



125-125 125 



= 0,0764 



ein 95,44 %-Konf idenzintervall für die unbekannte Wahr- 
scheinlichkeit 0 . 



b) Die Nullhypothese 



wird beim Signifikanzniveau 4,56 % abgelehnt, denn 



P-e 



Vv'-v 



/n 



30 2 

12 5 ~ 6 



VI 5 

\ 6*6 



/125 



= (-30- 

V125 



-i* 5 - 



6 = 7,2 - 5 = 2,2 



liegt im Ablehnungsbereich 



K - ( — 



^ 0 , 0228 ' 



(z 



o ,o228 # 



-2) v ( 2 ? 



Beim Signifikanzniveau 4,56 % kann geschlossen werden 
daß 6 / -- gilt. 




Die Nullhypothese H q : 6=1 wird also beim Signifikanz- 
niveau 4,56 % abgelehnt, obwohl das 95,44 %-Konfidenz- 
intervall für 0 die Zahl 1 = 0,16 überdeckt. Diese 
Situation kann deshalb eintreten, weil beim Testen von 
H 0 : 0 = 1 die Varianz von P durch die Nullhypothese mit 
fixiert ist, während sie bei der Konstruktion des Konfi- 
denzintervalls aus der Stichprobe geschätzt wird. 

c) Wir berechnen zunächst für die beobachteten Daten das 
arithmetische Mittel und die Varianz. 



X . 
1 


n . 
i 


x . n . 

l l 




1 


15 


15 


15 


2 


20 


40 


80 


3 


25 


75 


225 


4 


10 


40 


160 


5 


25 


125 


625 


6 


30 


1 80 


1080 


E 


_ 


475 


2185 



Es ergibt sich 



x = n Z x i n i = TT5 " 475 = 3 ' 8 



21 2 -2 1 2 
s = ^ I x i n i “ * = yl^.2185 - 3,8 2 = 3,04 



also s = /3,04 =1,74 



Die Hypothese y > 3,5 ist bestätigt, wenn die Nullhypo- 
these 



H o : y < 3,5 

abgelehnt werden kann. Da die Voraussetzungen für die An- 
wendbarkeit des Zentralen Grenzwertsatzes erfüllt sind, 
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ist das beim Signifikanzniveau 1 % der Fall, wenn die 
Prüf große 




S 



in den Ablehnungsbereich 

K = (z ,;») = (2,327 ; oo ) 
o , o 1 

fällt. Da das wegen 

3,8 ~ 3,5 /I 25 = 1 ,928 

1,74 

für die vorliegenden Beobachtungen nicht gilt, kann beim 
Signifikanzniveau 1 % nicht geschlossen werden, daß für 
den betrachteten Würfel die mittlere Augenzahl größer ist 
als 3,5 . 



4.6 Es sollen die Nullhypothesen 

a) H : 0 < 0,36 

o = 

b) H : 6 > 0,36 

o = 

c) H q : 6 = 0,36 
beim Signifikanzniveau 

a) 5 % ; b) 5 % ; c) 10 % 

und einem Stichprobenumfang n = 144 geprüft werden. 
Zeichnen Sie für jeden Test die Gütefunktion und die Opera- 
tionscharakteristik . 
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Lösung : 



Da der Stichprobenumf ang über 50 liegt, ist der Stichproben- 
anteilswert P in guter Näherung normalverteilt. Die Null- 
hypothese 



H : 0 < 0,36 
o = 

wird daher beim Signifikanzniveau 5 % abgelehnt, w£nn für 
den Stichprobenanteilswert P gilt 

P > 0,36+ Zp>o5 v / 2>.. 3 6 . 4 0, i 64 = 0(36+1 ,645-0,04 = 0/ 4258. 

H q wird also abgelehnt, wenn P in das Intervall [0,4258; 1] 
fällt. Die Wahrscheinlichkeit, mit der H q abgelehnt wird, 
hängt vom tatsächlichen Anteilswert 0 in der Grundgesamt- 
heit ab. Die Gütefunktion a(6) gibt diese Ablehnungswahr- 
scheinlichkeit in Abhängigkeit von 0 an. Da a(0) gleich 
dem Inhalt der Fläche ist, die zwischen der Dichtefunktion 
von P und dem Ablehnungsbereich K liegt (vgl. Abb. 9) , 




Abb. 9 



gilt 



ot (6) = 1 - <j) (0, 4258 | 0 



. / 0 ( 1 - 0 )' 
' V 144 



= 1 






/- 4258 ~ 6 - 12 ) . 



/e (1-0)' 
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Für einige Werte von 6 läßt sich a(0) sehr einfach 
berechnen. So ist 



a(0,1) = 1 



ot (0,2) = 1 



a (0,36) = 1 



a (0,4258) 



0,4258-0,1 >12 ^ = 1 

• /0 , 1 • 0 , 9 ' 



0,4258-0,2 
70 , 2 * 0,8 



12 



^ _ 



0,4258-0,36 . 12 ) = 1 
/Ö, 36 -0,64 



1 - <P (0) = 0,5 



<f> (13,032) 



<f> (6,774) 



0 



0 



0,05 



a (0,5) 



a (0,8) 



1 - t (°, . 1258 - 0 , 5 . 12 ^ 
r'0,5-0,5 

1 -^° L - 4 . 2 . 58 -°> 8 . 12 ) 
V /0 , 8 • 0 , 2 - 



♦(1,781) = 0,9626 



1 - ♦(-11,226) = 1 . 



a(0) ist also eine von 0 bis 1 ansteigende Funktion. 
Für 0 q = 0,36 gilt (entsprechend den Überlegungen bei der 
Konstruktion des Ablehnungsbereichs) 

a ( 6 Q ) = a 

und für die Grenze p* = 0,4258 des Ablehnungsbereichs er- 
hält man 

a (p* ) =0,5 . 

Um den Verlauf der Gütefunktion im Intervall von 0,36 bis 
0,5 besser zeichnen zu können, berechnen wir a(G) noch 
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für 0 = 0,4 und 0 = 0,45 . Es ergibt sich 



a(0,4) = 1 - *( P' 4 . 2 . 58 rP' 4 . 12 )= 1 - *(0,632) = 0,2637 
/0, 4 *0, 6 

o (0, 45) = 1 - *(’ Pf . 42 . 5 . 8 . ~ 0 f4 5 .i2)= 1 - *(-0,584) = 0,7204 . 
/O, 45-0, 55 

Die Gütefunktion hat also folgenden Verlauf (vgl. Abb.10). 

<*( 0 ) 0 ( 0 ) 

1,00 

0,50 
0,05 

Abb. 10 

Abb. 10 enthält auch die Operationscharakteristik (OC-Kurve) 
3(9) = 1 ~ o(0) . 

Sie gibt - in Abhängigkeit von 0 - die Wahrscheinlichkeit 

dafür an, daß H q nicht abgelehnt wird. Gütefunktion und 
Operationscharakteristik schneiden sich über der Grenze 
des Ablehnungsbereichs. Dort gilt 

ot (p* ) = ß(p*) = 0,5 . 
b) Die Nullhypothese 
H o : 9 = 0,36 




0,4258 
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wird beim Signifikanzniveau 5 % abgelehnt, wenn für den 
Stichprobenanteilswert gilt 



P < 0,36 



/ 0,36*0,64 
z o,o5 V 144 



0,2942 . 




Für die Wahrscheinlichkeit, mit der H q abgelehnt wird, 
wenn 9 der tatsächliche Anteilswert in der Grundgesamt- 
heit ist, folgt dann (vgl. Abb.11). 



a (0) 



(0,2942 




e(i-e') 

144 



0, 2942-6 # 1 2 ^ 

/e (1-9) 



Im einzelnen erhält man 



a(0,1) 



0,2942-0,1 ^ 
/0, 1*0,9 



(7,768) = 1 



a(0,2) = ,( Pj . 2942 SU I.t?) = $(2,826) = 0,9977 
v /0 , 2 • 0 , 8 ' 7 



a (0,2942) = $ (O) = 0,5 

a (O , 36 ) = <t> ( _ z q5 ) = 0,05 

a(0,5) = ^,(0^2942^0^5 . 12 ) _ $(-4,9392) = 0 . 

' /O, 5 *0, 5 1 
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Die Werte der Gütefunktion fallen also monoton von 1 bis 
O . Um den Verlauf der Gütefunktion zwischen 0,2 und 
0,36 besser zeichnen zu können, berechnen wir noch zwei 
Werte . 

a (0, 25) = <(> ( °-'. 2942 ~°' rP- 1 2 ; = 4,(1,225) = 0,8898 
Wo, 25-0, 75 



a (0,32) 



° / 2942 °' . 22 . 1 2 ) = 4 , (-0,6637) 
/0, 32*0, 68 



= 1 - 4,(0,6637) = 0,2534 . 

In Abb. 12 wird der Verlauf der Gütefunktion und der 
Oper ations Charakteristik dargestellt 



<x(0) ß(d) 




Abb. 12 



c) Die Nullhypothese 
H q : 0 = 0,36 

wird abgelehnt, wenn sich der Stichprobenanteilswert "zu 
stark" von 0,36 unterscheidet. Für die Grenzen des Ab- 
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lehnungsbereichs gilt beim Signifikanzniveau 10 % 



0,36 + z o ^ o5 y = 0,36 + 0,0658 . 

H q wird also abgelehnt, wenn der Stichprobenanteilswert 
entweder in das Intervall [0; 0,2942] oder in das Inter- 
vall [0,4258 ; 1] fällt (vgl. Abb. 13). 



ip(x|0;v/0(1-0)/144) 




Abb . 1 3 



Der Ablehnungsbereich für den Test der einfachen Nullhypo- 
these H q : 6 =0,36 beim Signifikanzniveau 10 % ist 
also die Vereinigung der Ablehnungsbereiche der in a) und 
b) behandelten Tests der zusammengesetzten Nullhypothesen 
H : 6 < 0,36 und H : 0 > 0,36 beim Signifikanzniveau 
5 % . Da die beiden Ablehnungsbereiche disjunkt sind, ist 

dann die Gütefunktion des Tests von H : 0 = 0,36 die 

o 

Summe der Gütefunktionen der beiden anderen Tests 

a(6) = 4> (0, 29 42 | 6 ,* -J ) 

V 1 44 ( 1 

+ 1 - ^ (0,4258 | 6; 1 ) . 

Mit den in a) und b) erhaltenen Werten ergibt sich für die 
Gütefunktion (1) folgendes Bild (vgl. Abb. 14). 
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ocid) 




Abb . 1 4 

Die Gütefunktion des Tests für H q : 0 = 0,36 unterschei- 
det sich links von 0,36 um weniger als 0,05 von der 
Gütefunktion des Tests für H q : 0 >0,36 und rechts von 
0,36 um weniger als 0,05 von der Gütefunktion des Tests 

für H : 0 < 0,36 . Bei 0 =0,36 erreicht sie ihr Mini- 
o 

mum. In Abb. 15 sind die Gütefunktion und die Operations- 
charakteristik für den Test der Nullhypothese H q : 0 =0,36 
dargestellt 




Abb. 15 

Eine grobe Übersicht über den Verlauf der Gütefunktionen 
für die verschiedenen Nullhypothesen kann man sich auf fol- 
gende Weise verschaffen: Hat das interessierende Ereignis 
die Wahrscheinlichkeit 0=0 oder 0=1, so wird man 
in der Stichprobe stets auch P = 0 bzw. P = 1 beobach- 
ten. Entsprechend der Lage des Ablehnungsbereichs folgt 
dann für die verschiedenen Nullhypothesen 
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ot ( O ) ; ot ( 1 ) 



D 

0 ) 

1 ) 



o 



f (0 

Id 



für H 

c 

für H 

c 

für H 



< e 

± 6 o 
= 6 o 



Daraus ergibt sich der ungefähre Verlauf der Gütefunktion 
anhand folgender Überlegungen. Gütefunktionen von Tests 
zusammengesetzter Nullhypothesen verlaufen monoton und 
nehmen an der Grenze des Ablehnungsbereichs den Wert j 
an. Jede Gütefunktion eines Tests der einfachen Nullhypo- 
these H : e = 0 läßt sich als Summe von Gütefunktionen 
o o 

zu Tests der zusammengesetzten Nullhypothesen H q : 6 < 6 q 
und H : e > G erhalten. Schließlich gilt für jede Güte- 

0=0 n J 

funkt ion 



ot ( 0 ) = a . 

Für einfache Nullhypothesen ist das gleichzeitig der klein- 
ste Wert, den die Gütefunktion annehmen kann. 



4.7 Die Nullhypothese 
H Q 5 6 < 0,5 

soll bei einem Signifikanzniveau von 5 % durch eine Stich- 
probe vom Umfang 



a) 


n = 64 


b) 


n = 100 



geprüft werden. Zeichnen Sie die Gütefunktion für die bei- 
den Tests. 
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Lösung : 



Die Nullhypothese 



H : 0 < 0,5 
o 



wird beim Signifikanzniveau 5 % abgelehnt, wenn für den 
Stichprobenanteilswert P gilt 



P > 0,5 + 1 ,645 



0 , 5 • 0 , 5 
n 



0,5 



0,8225 

/n 



Der Ablehnungsbereich des Tests ist daher für n = 64 das 
Intervall (0,6028 ; 1] und für n = 100 das Intervall 
(0,58225 ; 1 ] (vgl. Abb. 16) . 



K bei n=100 - 



1,0 



K bei n=64 ■ 



0,5 0,58225 0,6028 



Abb . 1 6 



Die Güte funkt ionen sind also monoton steigende Funktionen, 
die für 0 =0,5 den Wert 0,05 und für 0 = 0,6028 bzw. 
0 = 0,58225 den Wert 0,5 annehmen. Die Gütefunktion 
lautet 



a(0) = 1 “ 



= 1 - 



k ( o ,5 + °' -' 82 - 2 - 5 

' Sn 



i .. /üsr ) 



0 , 5 + 2*8125 _ 0 

i( & SK ) 

v ✓e (T-e) ’ ' 



a) Für n = 64 ergibt das die Gütefunktion 



o(0) 



0,6028-0 Q 

«pjr ’ 8 
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Um sie zu zeichnen, berechnen wir sie für einige Werte von 
6 . Es ergibt sich 



a (0,4 5) = 1 - . 8 )= 1 - 4,(2,457) 

/O, 45-0, 55 

a (0,5) = 0,05 

a (0,55) = 1 - 4> (0,849) = 0,198 

ot (0,6) = 1 - $ (0,046) = 0,482 

ol (0,6028)= 0,5 

a (0,65) = 1 - <{> (-0 , 79 ) = 0,785 

a (0,7) = 1 - 4»(-1 ,697) = 0,955 

a (0,7 5) = 1 - <J>(-2 ,720) = 0,997 

b) Entsprechend erhält man als Gütefunktion für n 

a( 9 ) - 1 - * r 0 ' 5 . 8225 - 9 - 10 
^ ✓e ( 1 — e ) 

Auch hier berechnen wir a(0) für einige 6-Werte. Es 
gibt sich 



ol (0,45) = 1 - 4> (2,658) = 0,0039 
cc (0,5) = 0,05 

a (0,55) = 1 - <|> (0,648) = 0,2585 
a (0,58225) =0,5 
a (0,6) = 1 - 4> (-0, 362) = 0,6413 

a (0,7) = 1 - <p ( - 2, 5 6 9 ) = 0,9949 



0,007 



100 



er- 
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In Abb. 17 sind die beiden Gütefunktionen mit Hilfe der 
in a) und b) berechneten Werte gezeichnet. 



a(0) 




Abb . 1 7 



Man sieht: Die Gütefunktion verläuft um so steiler (der 
Test ist also um so besser) , je größer der Stichprobenum- 
fang n ist. Die beiden Güte funkt ionen schneiden sich für 
6 = 0,5 . 



4.8 Ein Test zur Widerlegung der Hypothese 

H o : 6 > 0,6 

soll so geplant werden, daß gilt 

a (0,5) = 0,9 

a (0,64) = 0,001 . 

a) Wie sind der Ablehnungsbereich und der Stichprobenum- 
fang zu wählen, wenn der Stichprobenanteilswert als 
Prüfgröße verwendet wird? 

b) Wie hoch ist das Signifikanzniveau dieses Tests? 
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Lös ung : 



a) Beträgt der Stichprobenumfang mindestens 50 , so ist 
die Prüfgröße P in guter Näherung normalverteilt (vgl .Abb . 18) 




Dann sind die Grenze p* des Ablehnungsbereichs und der 
Stichprobenumfang n so zu bestimmen, daß ungefähr gilt 



0,9 = 4>(p*|0,5; ) = * ( / n ) 



0,999 = 1 - $ (p* | 0 , 64 ; J / n ) . 



Suchen wir in der Tabelle der Normalverteilung für die 
<J>-Werte 0,9 und 0,999 die zugehörigen z-Werte auf, 
so erhalten wir für p* und n die Bedingungen 

1 , 282=E IzO i 5 

(D 

3,1 = 9 . jL*rE l /n . 

0,48 

Das sind zwei Gleichungen für die beiden unbekannten Para- 
meter der Gütefunktion. Bei zusammengesetzten Nullhypothe- 
sen ist also der Verlauf der Gütefunktion schon durch zwei 
ihrer Werte vollständig bestimmt, d.h. durch zwei vorgege- 
bene Punkte verläuft immer nur eine solche Gütefunktion. 
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Dividieren wir die beiden letzten Gleichungen durcheinan- 
der, so erhalten wir für p* 



1,282 _ p*-0 , 5 0,48 

3,1 0,5 *0 , 64-p* 



d. h. 



1 ,282 

(0,64 - p*) 



(P* 



0,5) 



0,48 

0,5 



d. h. 



p* = 0,5421. 

Setzen wir den Zahlenwert von p* in die Gleichung (1) 
ein, so folgt für n 

1,282 = 2 ^4 2 1 ^0 , 5 ^ d . h . 

0,5 

n = 231 ,82. 

Die Bedingungen a(0,5) = 0,9 und a(0,64) = 0,001 sind 
also näherungsweise erfüllt, wenn als Ablehnungsbereich 

K = [ 0 ? 0,5421 ) 



und als Stichprobenumf ang n = 232 gewählt wird. 



b) Da für den Endpunkt p* des Ablehnungsbereichs allge- 
mein gilt 



p* 



e - 

o 



e_(1-e ) 

o o 



folgt in unserem Falle 

0,5421 = 0,6 - z o /-■ ' ■ 2y° f - 4 ' = 0,6 - z a *0, 03216 

und damit 



z 

a 



0,6-0,5421 

0,03216 



1 ,800 



d. h. 



298 




1 - a = <J> ( z ) = <{>(1,8) = 0,9641 



d. h. 



a = 0,0359 . 

Der Test besitzt also das Signifikanzniveau 3,59 % . 



4.9 Es wird vermutet, daß das Wahlergebnis für einen be- 
stimmten Kandidaten im Wahlbezirk A besser ausfällt als im 
Wahlbezirk B. Wird diese Vermutung durch eine Meinungsum- 
frage, bei der sich im Wahlbezirk A 44 % und im Wahlbezirk 
B 36 % für den betreffenden Kandidaten aussprachen, bestä- 
tigt, wenn in den Wahlbezirken A und B 



a) 


50 


bzw . 


60 


b) 


200 


bzw . 


240 



Personen befragt wurden? (Signifikanzniveau 10 %) 

Lösung : 

Wir bezeichnen mit 0^ bzw. 0 ß den Anteil der Anhänger 
des interessierenden Kandidaten im Wahlbezirk A bzw. B . 
Die Vermutung 6^ > 0 ß ist bestätigt, wenn die Nullhypo- 
these 



abgelehnt werden kann. Das ist beim Signifikanzniveau 10% 
der Fall, wenn die Prüfgröße 



V "A n B 
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in den Ablehnungsbereich 



K = ( z ; « ) = ( 1,282 ;«) 

, I 



fällt. 



a) Als Realisation der Prüfgröße ergibt sich mit den 
angegebenen Werten 



0,44 - 0,36 



0,44*0,56 + 0,36*0,64 
50 60 



0,854 . 



Da sie nicht im Ablehnungsbereich liegt, kann beim Signi- 
fikanzniveau 10 % nicht gefolgert werden, daß das Ab- 
stimmungsergebnis für den Kandidaten im Wahlbezirk A bes- 
ser sein wird als im Wahlbezirk B . 

b) Mit den größeren Stichprobenumfängen ergibt sich für 
die Prüfgröße der Wert 



0,44 - 0,36 



0 , 



44*0,56 

200 



0,36*0,64 

240 



1,708 . 



Da er in den Ablehnungsbereich fällt, ist die Nullhypothe- 
se widerlegt. Mit einer Irrtumswahrscheinlichkeit von 10 % 
kann gefolgert werden, daß das Wahlergebnis im Wahlbezirk 
A besser ausfällt als im Wahlbezirk B . 



4.10 In einer Firma ist man daran interessiert zu wissen, 
ob das Unfallrisiko an den verschiedenen Wochentagen gleich 
hoch ist. Man ermittelt (im Laufe von mehreren Monaten) 
folgende Verteilung der Unfälle nach Wochentagen 
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Wochentag 


Montag 


Dienstag Mittwoch 


Donnerstag 


Freitag 


Zahl der 

rinf äl 


26 


17 22 


24 


31 



Kann die Hypothese, das Unfallrisiko sei für alle Wochen- 
tage gleich hoch, bei einem Signifikanzniveau von 5 % als 
widerlegt angesehen werden? 



Lösung : 

Die Hypothese, das Unfallrisiko sei für alle Wochentage 

gleich, bedeutet, daß für jeden Wochentag der Anteil 0. 

1 1 

an der Gesamtzahl der Unfälle bei liegt. Um die Null- 

hypothese 

H q : 6 ± 1 für i = 1 , 2 , . . . , 5 

zu testen, müssen wir zunächst den Wert der Prüfgröße 

5 (n, -ne. ) 2 

I — ± - — 

i=1 n0 . 

l 

berechnen. Da insgesamt 120 Unfälle im Beobachtungszeit- 
raum registriert wurden, gilt 



ne ± = 24. 

Damit folgt 

5 2 
Z (n. - 24) z 

i=1 “ u i *•’ i-1 



5 (n ± - n6 i ) ' 

£ Q 



94 



= T4 t 2 2 + ?2 + 2 2 + 0 + 7 2 ] = 4,4167. 

Da die Zahl der Freiheitsgrade 5-1=4 ist, ergibt sich 
2 

aus der Tabelle der X -Verteilungen für ein Signifikanz- 
niveau von 5 % der kritische Wert 
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X 



9,488 . 



2 

4 ;o,o5 

Da die Realisation der Prüfgröße unterhalb dieses Wertes 
liegt, kann man die Hypothese, das Unfallrisiko sei an al- 
len Wochentagen gleich, bei einem Signifikanzniveau von 
5 % nicht ablehnen. 

4.11 An einer Bundesstraße wird die Geschwindigkeit von 
1000 vorbei fahrenden Kraftfahrzeugen gemessen: 



Geschwin- 

digkeit 


unter 

30 


30 bis 
unter 60 j 


60 bis 
unter 80 


80 bis 
unter 90 


90 bis 
unter 1 20 


über 

120 


Anzahl der 
Fahrzeuge 


2 


4 


310 


363 


320 


1 



a) Widerlegt dieses Ergebnis die Hypothese, daß die Ge- 
schwindigkeiten normalverteilt seien mit Mittelwert 
y = 80 km/h und Standardabweichung o = 10 km/h ? 
(Signifikanzniveau 5 %) 

b) Wie ist bei der Hypothese "normalverteilte Geschwindig- 
keiten mit Mittelwert y = 85 km/h und Standardabwei- 
chung o = 10 km/h " zu entscheiden? 

Lösung : 

a) Die Nullhypothese lautet hier 

H Q : F(x) = *( X | 80 ; 10 ) = * ( ) . 

Sie wird geprüft, indem wir für die vorgegebene Klassenein- 
teilung die beobachtete Häufigkeitsverteilung mit der auf- 
grund der hypothetischen Verteilungsfunktion zu erwartenden 
Häufigkeitsverteilung vergleichen. Wir berechnen daher zu- 
nächst die Wahrscheinlichkeiten 0^ , mit denen die Werte 
einer (80 ; 1 0) -normal verteilten Zufallsvariablen in die 
verschiedenen Klassen fallen (vgl. Abb.19). 
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30 



Abb . 1 9 



60 80 90 



120 



Es ergibt sich 



e 1 


= <f> ( 


JU-OU x 

io ' 


= <fi ( 


:-5) = o 








9 2 


= 4> ( 


60-80 
10 * 


- <H 


u> 
O 
O 1 
00 
O 


= <f>(-2) 


i = 0,0228 




9 3 


= ( 


80-80 , 

10 } 


- (f) ( 


, 60-80 . 
10 ' 


= <P (0) 


- <f> (-2) = 


0,4772 


9 4 


= <t> ( 


o 

O l 

00 

O 


- <M 


, 80-80 , 
10 ] 


= 4>(1) 


- 4> (0) = 


0,3413 


9 5 


= <P ( 


120-80 , 

10 J 


i - <p ( 


O 
O 1 

00 

O 


= *(4) 


- 4» ( 1 ) = 


0,1587 



Wegen 0 ^ = 0^ =0 sind die hypothetischen Häufigkeiten 
n0^ im 1. und 6. Intervall < 5 . Folglich müssen wir die 
Nullhypothese nochmals durch Zusammenfassen benachbarter 
Intervalle vergröbern. 
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Wir erhalten so 



Geschwin- 

digkeit 


n i 


e . 

i 


n0 . n . 
i l 


-n6 . 
l 


(n . -n0 . ) 2 
l i 


(n^ne^ 2 

ne. 


< 30 


2 1 6 


0 } 


23 


17 


289 


12,5652 


30 - 60 


4 J 


0,0228J 










60 - 80 


310 


0,4772 


477 


167 


27 889 


58,4675 


80 - 90 


363 


0,3413 


341 


22 


484 


1,4193 


90 - 120 


320-1 


0,1587t 










über 

120 


'■321 
1 ■' 


0 } 


159 


162 


26 244 


165,0566 


I 


1000 










237,5086 


Die Zahl 


der Freiheitsgrade 


beträgt 


3 , 


, da durch 


das Zusam- 


menfassen 


aus den 


ursprünglich 6 


Intervallen 4 


wurden. 


Wegen 














2 

X 


3;o,o5 ~~ 


7,815 










ist der Wert der 


Prüf große 


signifikant , 


d. h. wir 


lehnen 



die Nullhypothese bei einem Signifikanzniveau von 5 % ab. 

b) Die Nullhypothese lautet jetzt 

H q : F(x) = *( x | 85 ; 10 ) . 

Die Berechnung des Wertes, den die Prüf große annimmt, ver- 
läuft analog wie in a) . Auch hier müssen wieder das 1 . 
und 2. sowie das 5. und 6. Intervall zusammengefaßt werden. 
Man erhält 
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Geschwin- 

digkeit 


n . 

l 


0 . 
1 


ne i i 


n i- ne i 


(n i -n6 i ) 2 


(n^nO i ) 2 

nö . 

1 


< 30 
30 - 60 


2 ) 6 
4 J 


j 0 1 

0,0062} 


6 


0 

1 


0 | 


0 


60 - 80 


310 


i 0,3023 302 


8 

i 


64 


0,2119 


80 - 90 


363 

1 


0,3830 


383 


! 

-20 


400 


co 

O 


90 - 120 

über 
1 20 


3 20] 
r3 2 1 

1 J 


0,3085". 

0 J 


309 


12 


1 44 


0,4660 


Z ! 


1000 ! 








1 ,7222 



In diesem Falle liegt der Wert der Prüfgröße unterhalb der 
kritischen Grenze 



2 

X 3;o,o5 



7,815 



d. h. die aufgestellte Hypothese kann nicht verworfen wer- 
den . 



4.12 Die Realisationen zweier verbundener Stichproben vom 
Umfang 300 ergaben bzgl. der Merkmale )( und die fol- 
gende Kontingenztabelle 



\ y 


*1 


^2 


^3 


x 






x i 


35 


25 


40 


x 2 


88 


32 


80 
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Kann bei einem Signifikanzniveau a = 0,05 behauptet 
werden, H und seien abhängig? 

Lösung : 

Die Hypothese, X und sind abhängig, ist dann bestä- 

tigt, wenn die Nullhypothese 

H q : X und ^ sind unabhängig 

abgelehnt werden kann. 

Da für die Zahl der Freiheitsgrade bei der angegebenen Kon- 
tingenztabelle 



(2 - 1 ) • (3 - 1 ) = 2 



gilt, ist das bei einem Signifikanzniveau von 5 % der Fall, 
wenn gilt 



2 

I 

i=1 



3 

I 

j = 1 



( n 



± 1 . 



u ) 



* X 2 ;0/05 • 



n 



Mit den in der Kontingenztabelle gegebenen Häufigkeiten 
folgt 



n .1 


= 


35 


+ 


88 


= 


123 


n . 2 


= 


25 


+ 


32 


= 


57 


n . 3 


= 


40 


+ 


80 


= 


120 


n 1. 


= 


35 


+ 


25 


+ 


40 = 100 


n 2 . 


= 


88 


+ 


32 


+ 


80 = 200 


n 


— 


100 ■ 


f 200 


= 300 . 



Damit können wir die bei der Unabhängigkeit von X und 
zu erwartenden hypothetischen Häufigkeiten 
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n 



bestimmen. Man erhält 




Da alle hypothetischen Häufigkeiten > 5 sind, sind die 

2 

Voraussetzungen für die Anwendung des x “Unabhängigkeits- 
tests erfüllt. Für die Summanden der Prüfgröße ergeben sich 
die Werte 




Damit erhalten wir 

0,878 + 1 ,8947 + 0,439 
+ 0,9473 = 4,1590 . 

Dieser Wert ist kleiner als 
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Also kann H q bei einem Signifikanzniveau von 5 % nicht 
abgelehnt werden, d. h. aus der vorliegenden Kontingenzta- 
belle kann nicht auf die Abhängigkeit von X und ^ 9 e ” 

schlossen werden. 



4.13 Man befragt 500 Neuimmatrikulierte verschiedener Uni- 
versitäten nach ihren Abiturnoten in Deutsch und Mathematik. 



Es ergibt 


sich 


folgende 


Tabel 


le 








| Mathematiknote 








1 


2 


3 


4 


Deutsch- 


1 


5 


12 


15 


10 


note 


2 


9 


45 


69 


29 




3 


12 


40 


77 


67 




4 


6 


23 


27 


54 



Widerlegen diese Daten beim Signifikanzniveau 1 % die 
Hypothese, die Noten in Deutsch und Mathematik seien un- 
abhängig? 

Lösung : 

Die Nullhypothese, die Noten in Deutsch und Mathematik sei- 

2 

en unabhängig, kann mit dem x -Unabhängigkeitstest über- 
prüft werden. Dazu berechnen wir wie in 4.12 die hypothe- 
tischen Häufigkeiten 



n 



308 




Es ergibt sich folgende Tabelle 



\ M 

D 

x 


1 


2 


3 


4 


n . 

l . 


1 


3 


10 


1 6 


1 3 


42 


2 


10 


37 


57 


48 


152 


3 


1 2 


47 


74 


63 


196 


4 


7 


26 


41 


36 


1 10 


n . 

• 3 


32 


120 


188 


160 


500 



Da wegen 

n 1 . n .1 

— — = 3 < 5 

n 

o 

die Voraussetzungen für die Anwendung des x -Tests nicht 
erfüllt sind, müssen wir die Nullhypothese durch Zusammen- 
fassen der Noten 1 und 2 bei Deutsch oder bei Mathematik 
vergröbern. Entscheiden wir uns für die Vergröberung bei 
den Deutschnoten, so sind in den obigen Tabellen jeweils 
die beiden ersten Spalten zusammenzufassen. In der folgen- 
den Tabelle stehen links die beobachteten und rechts die 
hypothetischen Häufigkeiten 



\ M 
D 


| 

1 oder 2 j 


3 


4 


1 


17 


13 


15 


16 


10 13 


2 


54 


47 


69 


57 


29 48 


3 


52 


59 


77 


74 


67 63 


4 


29 


33 


27 


41 


54 36 
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Daraus ergibt sich für die Prüfgröße der Wert 



II 



(n . . 



n . 

1 



n 



zl 



2 



) 



n 



n i. n .j 



n 




r; 

16 



H 

13 



2 2 
7 + 12 4 - 

47 + “5T + 



1 9 2 



59 



3 2 

74 



Ü 

63 



33 



14 2 ift 2 

+ ‘TT + = 28 ' 5467 • 

Bei der Bestimmung der Anzahl der Freiheitsgrade hat man 
von der reduzierten Anzahl der Zeilen und Spalten auszuge- 
hen und erhält 



(3 - 1) • (4 - 1) = 6 . 



Der kritische Wert 



x 6 ;o,o1 



16,812 



ist kleiner als der Wert der Prüf große. Folglich ist beim 
Signifikanzniveau 1 % die Hypothese der Unabhängigkeit 
der Noten in Deutsch und Mathematik abzulehnen. 
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Regressionsanalyse 



1. Problemstellung 



1.1 In den Wirtschaftswissenschaften interessieren Zusammen- 
hänge zwischen ökonomischen Variablen. Beispielsweise ver- 
sucht man, die von einem bestimmten Gut abgesetzte Menge q 
als Funktion des dafür geforderten Preises p zu erklären. 

Man nennt dann p erklärende und q erklärte Variable. 

Natürlich wird die abgesetzte Menge außer vom Preis auch von 
anderen Faktoren, wie etwa den Preisen für Konkurrenzgüter 
und den Werbeausgaben, mitbestimmt. Wenn man die abgesetzte 
Menge trotzdem als Funktion f(p) des Preises p bezeichnet, 
unterstellt man, daß der Preis die einzige Variable ist, die 
systematischen Einfluß auf den Absatz hat, während die Ein- 
flüsse der übrigen Faktoren sich im Mittel gegenseitig auf- 
heben und als zufällig betrachtet werden. Wird also das be- 
treffende Gut an verschiedenen Orten zu verschiedenen Zeiten 
zum festen Preis p angeboten, so wird im Durchschnitt die 
Menge f(p) abgesetzt. Betrachten wir die zum Preis p an einem 
bestimmten Ort zu einer bestimmten Zeit abgesetzte Menge als 
Zufallsvariable Q, so ist f (p) der Erwartungswert, und es 
bietet sich der Ansatz 

Q = f (p) + U ( 1 ) 

zur Erklärung der Zuf allsvariablen Q an. Dabei ist U eine 
Zufallsvariable, die alle nichtsystematischen Einflüsse auf- 
fängt und die Eigenschaft EU = 0 besitzt. 

1 . 2 Wir wollen im folgenden 

Y = f ( x ) + U (2) 
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anstelle von (1) schreiben und unter Y irgendeine Zufalls- 
variable verstehen, die durch eine Variable x erklärt wer- 
den soll, so wie vorangehend der Absatz durch den Preis. 

Der Einfachheit halber werden wir nur den Spezialfall 

Y= 8 Q + 3-jX+U (3) 

von (2) betrachten. Da nach wie vor EU = 0 vorausgesetzt 

wird, bedeutet das, daß der Erwartungswert EY der erklärten 

Variablen als lineare Funktion 8 + 8-,x der erklärenden Va- 

o 1 

riablen x vorausgesetzt wird. 

Wenn (3) erfüllt ist und EU = 0 gilt, nennt man 8 Q und 8^ 
Regressionskoe ffizienten ; die durch 8 Q und 8 -j festgelegte 
Gerade y = 8 Q + 8-jX heißt Regressionsgerade (vgl. Abb . 1). 



y 




Abb. 1 

1.3 Im allgemeinen sind die Regressionskoeffizienten unbe- 
kannt. Da die sog. Residualvariable U nicht beobachtet wer- 
den kann, lassen sich die Regressionskoeffizienten auch bei 
Vorliegen von Beobachtungen nicht berechnen. Man hat sich 
also zu überlegen, wie man sie schätzen kann und wie Hypo- 
thesen zu prüfen sind. 

1.4 Wenn, wie vorangehend erläutert, eine Zufallsvariable 

Y durch eine einzige Variable x erklärt werden soll, spricht 
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man von Regression oder auch von Einfachregression , wenn 
mehrere Variablen zur Erklärung herangezogen werden, von 
Mehrfachregression . Wir werden uns im folgenden ausschließ- 
lich mit der Einfachregression befassen und nur das sog. 
"lineare Regressionsmodell" (3) ausführlich diskutieren. 



2. Lineares Modell mit einer erklärenden 
Variablen 

2.1 x-, x~ , ..., x seien n Werte einer erklärenden Vari- 

1 2 ' n 

ablen. Wir bezeichnen die dazu beobachteten Zufallsvariablen 
mit , Y 2 / •••/ Y n . Aufgrund der Annahmen in 1.2 gilt 



Y . 

l 



U i 



( 1 ) 



Y = 
n 



ß 1 x n 



+ U 



mit 

EU 1 = EU 2 = . . . = EU n = 0. 



( 2 ) 



Unter Umständen darf man zusätzlich voraussetzen, daß 



EU.Üj 



2 

a für i = i 

u J 

0 für i f j 



gilt. Dann ist für i = 1, 2, 



, n insbesondere 



var U^ 



EUT 



(EIL) 2 = EU 2 



o 



2 

u 



(3) 



erfüllt, d. h. die Varianzen aller Residualvariablen stimmen 
überein. Außerdem hat man für i f j 

cov (U ± ,Uj) = EU ± Uj - EU ± EU j = 0 
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d. h. die Residualvariablen sind paarweise unkorreliert 
(vgl. W 3.4.7) . 

Die Voraussetzung (3) ist in dem in 1.1 betrachteten Bei- 
spiel sicher verletzt, wenn die zu alternativen Preisen ab- 
gesetzten Mengen auf so engem Raum erhoben werden, daß die 
Käufer die Möglichkeit haben, unter den verschiedenen Ange- 
boten auszuwählen. Hingegen ist die angegebene Bedingung 
immer erfüllt, wenn die Residualvariablen paarweise unab- 
hängig sind (vgl. W 3.4.7). 

2.2 Die Annahmen (1), (2) und (3) in 2.1 werden häufig unter 

der Bezeichnung "einfaches lineares Regress ionsmodell" zu- 
sammengefaßt. Offenbar folgt aus (2) für die Beobachtungen 

EY^ = + 6 , i = 1 , 2 , . . . , n 



oder 



Y ± - EY ± = U ± , i = 1 , 2 , . . . , n 
und damit 

cov (Y i ,Y j ) = E(Y ± - EY ± ) (Yj - EY . ) = EU-Uj . 

Im einfachen linearen Regressionsmodell haben also die Y. 

2 1 

wie die th alle die gleiche Varianz a u , und sie sind paar- 
weise unkorreliert. 

2.3 Wir werden uns überlegen, wie unter den Voraussetzungen 
(1), (2) und (3) in 2.1 effiziente lineare Schätz funktionen 

für 3 Q und 3 -j zu konstruieren sind. Wenn Konfidenzintervalle 
für 3 Q und 3^ angegeben werden sollen, muß man entweder vor- 
aussetzen, n sei eine große Zahl, oder man hat von geeigne- 
ten Annahmen über die Verteilung der Residualvariablen aus- 
zugehen. Wir werden zur Konstruktion von Konfidenzintervallen 
die Voraussetzungen des einfachen linearen Regressionsmodells 
durch die Forderung ergänzen, daß die Residualvariablen , 

U 2 ' •••' u n unabhängige normalverteilte Zufallsvariablen 
sind. 
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Wir fordern also, daß gilt 



= 3 Q + 3 1 x ± + U ± i = 1, 2, n 



mit unabhängigen (0 , g u ) -normalverteilten LL (vgl. Abb . 2) 



Dichte von Y 




Abb. 2 

Da dann nach Voraussetzung alle Residualvariablen U. den 

2 1 

Erwartungswert 0 und die Varianz haben und als unabhängige 
Zufallsvariablen nach W 3.4.7 auch paarweise unkorreliert 
sind, ist in der Tat ein Spezialfall des bisher betrachteten 
einfachen linearen Regressionsmodells gegeben. 



3. Methode der kleinsten Quadratsumme 

3.1 Für beliebige Realisationen y^, y 2 , . . . , Y n der erklär- 
ten Variablen Y ^ , Y 2 , . . . , Y r bilden die Paare (x^y^), ..., 

(x n ,y n ) in der (x,y) -Ebene eine Punktwolke (vgl. Abb. 3) 
um die unbekannte Regressionsgerade 

y = b g + ß lX . 
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y 




Abb. 3 

Wir wollen uns überlegen, wie von den Beobachtungen (x^y^), 
( x n 'Y n )' dem Streuungsdiagramm, wie man auch sagt, auf 
die Regressionskoeffizienten ß Q und geschlossen werden 
kann. Dabei setzen wir lediglich (1) und (2) in 2.1 voraus. 
Unter dieser Voraussetzung ist eine Regressionsgerade y = 

3 q + ß-jX definiert und man wird hoffen, diese Regressions- 
gerade durch eine Gerade, die der erwähnten Punktwolke "an- 
gepaßt" ist, schätzen zu können. 

Zunächst denkt man vielleicht daran, eine Gerade so zu kon- 
struieren, daß die Summe aller Abstände der Punkte des Streu- 
ungsdiagramms von dieser Geraden möglichst klein wird. Diese 
Gerade wäre eventuell eine brauchbare Näherung für die unbe- 
kannte Regressionsgerade; sie ist jedoch analytisch schwer 
zu ermitteln. Viel einfacher ist es, eine Gerade 

y = b o + b lX 

so durch das Streuungsdiagramm zu legen, daß die Summe der 
Quadrate der vertikalen Abstände 

l ( Yi - b o - b lX .) 2 

minimal wird. Man nennt diese nach der sog. Methode der klein- 
sten Quadratsumme konstruierte Gerade die empirische Regre fi- 
sionsgerade (vgl. Abb. 4). 
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y 




Abb. 4 

3.2 Betrachten wir also die Funktion 
f (b 0 'bi ) = I (Yi " b 0 - b 1 x i ) 2 . 

Nach Definition sind b Q und b^ die Zahlen, die f(b Q ,b^) mini- 
mieren. Wir bilden die partiellen Ableitungen von f nach b Q 
und b^ 

r = - 2£ - w 

db 

o 

1|- = -2 E (y ± - b 0 - 
9b 1 

Notwendige Bedingung für ein Minimum ist das Verschwinden 
dieser Ableitungen 

0 = E (Yi _ b Q - b 1 x i ) = Eyj^ - n-b Q - b.,Ex i (1) 

0 = E (y ± - b Q - b 1 x i )x i = Ex^ - b Q Ex i - b.,Ex 2 (2) 

oder 

b -n + b-Ex. - ly. 

0 \ 1 1 

2 

b Ex. + b-Ex. = Ex.y. 

01 ii ri 



oder 
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b o + b lX = y 



- 2 

b nx + b^x. = Ex . y . . 

o II l-'i 

Aus der ersten Gleichung folgt 
b 0 = y - b ix. 

Subtrahiert man von der zweiten Gleichung das nx-fache der 
ersten, so erhält man 

2 -2 

b^ (Ex^ - nx ) = Ex^y^ - nxy 



oder 



b i - 



Zx i y i ' nxy 

2 "-2 * 
Ex - nx 

l 



Wegen 



E (x ± - x) (y ± - y) = E (x ± - x)y ± = 2x i y i - nxy 

und damit insbesondere 

E (x i - x) 2 = Ex 2 - nx 2 

folgt dann 



(x ± - x) (y ± - y) 
E (x ± - x) 2 



Damit ist die empirische Regressionsgerade konstruiert. 



1 ) 



^Vielfach konstruiert man empirische Regressionsgeraden 
nach der Methode der kleinsten Quadratsumme, ohne (1) und 
aus 2.1 vorauszusetzen. Man spricht in diesem Fall von de- 
skriptiver Regression . Vgl. z. B. SCHÖNFELD (1969), S.19 



( 2 ) 

ff. 
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3.3 Es liegt nahe f in b Q und die Zahlen y^, y^, • • • > Y n 
durch Zufallsvariablen Y^ , Y 2 , . . . , Y n zu ersetzen und die 
so gebildeten Zufallsvariablen 



B = Y - xB, 
o 1 



B 



1 



Z (x i - x) ( Y ± - Y) 
Hx, - x ) 2 



als Schätzfunktionen für die Regressionskoeffizienten zu 
verwenden. Wir wollen zeigen, daß B q und B ^ erwartungstreue 
Schätzfunktionen für ß Q und ß ^ sind. 

Nach 2.2 gilt 



EY i = ß o + ß 1 x i / i = 1, 2, ..., n. 

Hieraus folgt 

EY = ß Q + ß^ 

E(Y ± - Y) = ß 1 (x i - x) , i = 1, 2, ..., n 

und wir erhalten 



r i 

EB, = E l i 



- 2 v l 

Ux ± - x) z 



(Y. - Y) 



I L 



Z (x . - x) 



— E(Y i - Y) 



(x. - x) 

= B i 2 77: 77 = ß i 



Z (x i - x) ' 



EB q = EY - xEB 1 



ß Q + 8,x - 8l x = ß Q . 
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4. Effiziente lineare Schätzfunktionen für 
die Regressionskoeffizienten 



4.1 Im folgenden wollen wir zeigen, daß B q und für ein 
einfaches lineares Regressionsmodell effiziente lineare 
Schätzfunktionen sind. Die Beweisidee ist ähnlich wie in 
S 1.3.6. 



Wir betrachten zunächst B^ . Eine lineare Funktion der 



B = c + Ec.Y. 

O 11 



ist wegen 



EB = e o + IC.EY i = C Q + IC.(e o + f^X.) 



- c o + ß 0 IC. + 



für beliebige ß Q und genau dann erwartungstreue Schätz- 
funktion für ß i , wenn gilt 

c Q = 0, Zc i = 0, Ec i x i = 1. (1) 

Da Y.j , Y 2 , .../ Y n paarweise unkorreliert sind, gilt für die 
Varianz (vgl. W 3.4.7) 



2 2 2 
var B = Ec. var Y. = c -Ec. . 

1 l u i 



( 2 ) 



Sie wird für eine erwartungstreue Schätzfunktion von ß^ am 
kleinsten, wenn die c. unter den Nebenbedingungen (1) 

1 o 

so gewählt ■ werden , daß E c^ minimal wird. Wegen (1) gilt 



E c i ( x i - x) = Ec^x^ - xEc^ = 1, 



Damit folgt 
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•, 2 



E (x^-x ) 2 



ic 2 - 2 I 



c . (x . -x) 



(x. -x) 2 



l (x^x) ' 



l - r — ^ 



[l(x.-x ) 2 ] 2 



zc: 



1 Z (x . -x) 2 I (x . -x 
1 1 



— \ 2 



= Zc 2 



1 Z (x^-x) 



-v 2 



oder 



Zc 



; = z hi 



Z (x ± - x) 2 



Z (x i - x) 



2 • 



Da die rechte Seite am kleinsten wird, wenn der erste Summand 
2 

verschwindet, wird Zc^ unter den Nebenbedingungen (1) am 
kleinsten für 




i — 1, 2, • • • , n. 



Damit ist 



x . - X x . - X 

Ec i Y i = l 1 2“ 2 Y i = l 1 1 2 (Y i - Y > = B 1 

Z (x ± - x) 2 Z (x ± - x) 2 



effiziente lineare Schätzfunktion für 



4.2 Analog erfolgt der Beweis im Falle B Q . Die lineare 
Funktion B ist für beliebige B Q und 3^ genau dann erwar- 
tungstreue Schätz funktion für ß , wenn gilt 



c Q = 0, Zc ± = 1 , Zc i x i = 0. 



Wie oben zeigt man, daß unter diesen Nebenbedingungen Zcf 
minimal wird für 



i - x i - x 
Ci = " ' x 



i = 1 , 2, . . . , n 
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Damit ist 



1 _ x. - x , 

- - x =, y . = Iey. - xF 

i n 1 L „ , 



- x) 2 



Y. 



- 2 i 

l (x ± - x) Z 



= Y - XB, = B q 



effiziente lineare Schätzfunktion für $ Q . 

4.3 Mit 4.1. (2) erhält man für die Varianzen der Schätz- 
funktionen 



B = a 7 
o u L 



1 - x i - x 

_ x - 

Z(x ± - x) 2 



1 2 



2xZ (x ± - x) x 2 • Z (x ± - x) 2 

.2 -\2 + fr "\2i 2 



1 



n nz (x ± - x) z [Z (x ± - x)' 

2 



1 + 
n 



-2 

x 



Z (x ± - x) 2 



2 Ix i 



U nZ ( x^ — x ) 2 



und 



var B i = a u l 



S(x ± - x) 2 



Z ( x ± - x) 



2 * 



Es sei angemerkt, daß wegen 



var (Y - xB ^ ) = var B Q = + x 2 



Ux ± - x) 2 



= var Y + x var B 



offenbar 

cov (Y ,B 1 ) = 0 

gilt, d. h. Y und B ^ sind unkorreliert . 
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5. Konfidenzintervalle für die Regressions- 
koeffizienten 



5.1 Wir nehmen jetzt an, man habe ein einfaches lineares 
Regressionsmodell mit unabhängigen normalverteilten Resi- 
dualvariablen. Dann sind die Beobachtungen unab- 

hängige ( ß Q +ß -| , a^) -normalverteilte Zufallsvariablen, wes- 
halb die Schätzfunktionen B und B. als lineare Funktionen 

o 1 

der ebenfalls normalverteilt sind (vgl. W 5.2.2). Daher 
sind die Zufallsvariablen 




/var B 

l 



i = 0, 1 



standardnormalverteilt und es gilt 



W(-z 



B i - ß i 



a/2 



/var B . 



= Z a/2> = 1 ' “ 



0 , 1 . 



Mit den üblichen Überlegungen bei der Konstruktion von Kon- 
fidenzintervallen folgt dann, daß das Intervall 



B. - z • /var B ; B. + z /n */var B. j 
L i a/2 l i a/2 l J 



den Parameter ß^ mit der Wahrscheinlichkeit 1 - a überdeckt 

(i = 0, 1). Setzt man die in 4.3 berechneten Varianzen von 

B und B - ein, so erhält man, daß bei bekanntem a das In- 
o 1 r u 

tervall 



Zx i 

B - z / o • ö ”w Tr ; 

° a/2 u l/ nZ (x . -x) 2 



B o + \/2‘ a ui 



Ix i 



nZ (x^-x ) 2 



Konfidenzintervall für ß zur Konf idenz zahl 1 - a ist und 

o 
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Konfidenzintervall für 8 ^ zur Konfidenzzahl 1 - a ist. 

5.2 Im allgemeinen wird a u unbekannt sein. Dann sind die 
angegebenen Intervalle keine Konfidenzintervalle für 8 Q und 
8 ^ . Wegen 

El (Y. - ß Q - ß 1 Xi ) 2 = I EU 2 = na 2 

ist die mittlere quadratische Abweichung der Beobachtungen 
von der (wahren) Regressionsgeraden, also 

1 I (Yi - ß c - ß lX .) 2 

o 

eine erwartungstreue Schätzfunktion für er u , deren Realisa- 
tionen aber nicht berechnet werden können, da 8_ und 8., un- 

o I 

bekannt sind. Da die geschätzte Regressionsgerade - wie wir 
gesehen haben - diejenige Gerade ist, welche die Summe der 
quadrierten Abweichungen der Beobachtungen minimiert, gilt 

I< Y i - B o - B i x i> 2 ä - e i x i )2 

2 

weshalb a u durch 

I [ (Y i - B c - B lXi ) 2 

im Mittel unterschätzt wird. Man kann aber zeigen, daß 






2 

eine erwartungstreue Schätzfunktion für a u ist und daß die 
Zufalls variablen 
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B - 3 

o o 



nE(x.-x) 2 (B. - ß 1 ) /l (x.-x) 2 

i und ! = 



1x7 



u 



STUDENT-t- verteilt sind mit n - 2 Freiheitsgraden. Deshalb ist 



B-t n ~ • S i 
o n-2 ; a/2 u \ 



„ 2 
" x i 



I Zx 2 



; B + t 



-x2 ' ~o‘ ^n-2;a/2 \ -.2 

nZ (x^-x) y nl (x^-x) 



Konfidenzintervall zur Konf idenzzahl 1 - a für ß Q und 



B - - t ~ 0 

1 n-2;a/2 



/z (x i -x) 2 



; B ,. + t n 

1 n-2;a/2 



- 2 

< f Z (x i -x) 



Konfidenzintervall zur Konf idenzzahl 1 - a für ß ^ . Für 
n > 30 können die t-Werte durch die entsprechenden z-Werte 
der Standardnormalverteilung ersetzt werden. 

2 

5.3 Die Berechnung von aus den Stichprobenwerten erfolgt 

zweckmäßigerweise nicht nach der Definitionsgleichung, son- 
dern mit Hilfe der Identitäten 

S u = n=3 N - V Y i - B 1 Ex i Y ij 

= 5=5 - Y > 2 - B 1 E (x i - x >' Y i - Y) ]- 

Zum Beweis dieser Identitäten betrachten wir die sog. "Nor- 
malgleichungen" 3.2(1) und 3.2(2). Demnach gilt 

Z(y. - b - b - x . ) = 0 
n o 1 i 

und 

I (y . -b - b.x. )x. =0. 
vjr i o 1 1 1 

Es folgt 
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<n-2)sj; = E(y ± - b o - b^) 2 

= I( yi - b Q - b 1 x i )y i - b o E(y. - b o - b lX .) 

- b 1 E(y i - b Q - b lXi ) X± 

= SYi " V y i - b^y.. 

Das beweist die erste Identität. Wegen 

b o Ey i = <Y " b^x) I y i = n(y 2 - b.,xy) 
folgt weiter 

(n-2 ) s 2 = £y 2 - ny 2 - b^Ijc^ - n5y) 

= I (Y ± - y) 2 - b 1 Z( Xi - x) (y ± - y) 
womit auch die zweite Identität nachgewiesen ist. 

6. Prüfung von Hypothesen über die 
Regressionskoeffizienten 

6.1 Wir betrachten weiter einfache lineare Regressionsmo- 
delle mit normalverteilten Residualvariablen. Wenn 6^ irgend- 
eine vorgegebene reelle Zahl ist und die Nullhypothese 



beim Signifikanzniveau a geprüft werden soll, so berechnet 
man die Prüfgröße 

(B o 



- ß *) /nl ( Xi - x) 2 



S /ix. 
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Da sie bei Gültigkeit von H q STUDENT-t-verteilt ist mit n-2 
Freiheitsgraden, sieht man die Nullhypothese beim Signifi- 
kanzniveau a als widerlegt an, wenn die Prüfgröße eine Rea- 
lisation aus dem Ablehnungsbereich 

K = (-»; ~ t n -2;a/2 ) V (t n-2;a/2 ; 
annimmt . 



Zur Prüfung der Hypothese 



H : 3 < 3 * bzw. H 

0 0=0 o 



verwendet man dieselbe Prüfgröße wie vorher. Beim Signifi- 
kanzniveau a ergeben sich die Ablehnungsbereiche 



K 



(t 



n-2 ; a ' 



bzw . K 



fc n-2 ; a 



) . 



6.2 Ist 3 -j* eine vorgegebene reelle Zahl, so kann die Hypo- 
these 



H o : ß 1 



mit Hilfe der Prüfgröße 



(B 1 - ß* ) / e ( x i - x) 2 



getestet werden. Da die Prüfgröße bei Gültigkeit von H q 
STUDENT - t-verteilt ist mit n-2 Freiheitsgraden, wird man 
H q beim Signifikanzniveau a ablehnen, wenn die Realisation 
der Prüfgröße in den Ablehnungsbereich 



K 



t n-2;a/2 ) \J (t n-2;a/2 ; 



fällt. 



Entsprechend werden die Hypothesen 

Hq : U i ßi* bzw - H o : 6 1 b ß 1 * 
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beim Signifikanzniveau a abgelehnt, wenn die gleiche Prüf- 
größe einen Wert aus dem Ablehnungsbereich 



K 

annimmt 




bzw. K = <-«; -t n _ 2;o ) 



7. Aufgaben 

7.1 Aus 42 Wertepaaren (x^, y^) ermittelt man 



Z X . 
1 


= 252 


E *i 

- v 2 


= 210 


Z (x ± -x) 

-v 2 


= 100 


z (y ± -y) 


= 49 


z (x ± -x) (y ± -y) 


= 30 



a) 


Schätzen Sie die Regres 


sionsgerade . 


b) 


Geben Sie für 


ß Q und 


ß^ Konfidenzintervalle zur 




Kon fidenz zahl 


95,44 % 


an . 


c) 


Prüfen Sie die 


Hypothesen 



H o ; 


: e. 


< 0 


H o ; 


: ß o 


< 2 



bei einem Signifikanzniveau von 1 % . 

Lösung : 

a) Die Koeffizienten der geschätzten Regressionsgeraden 

y = b Q + b,* 

ergeben sich aus den Formeln 
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b = 



y - b ^ x 



b 1 = 



I x* y* 
i J i 

Ix? 2 

1 



wobei wir zur Abkürzung setzen 



y* = y . - y . 

i i x - 



Für x und y ermittelt man aus den angegebenen Daten 



x = —Ix. = -rL 252 = 6 
n i 4 2 



y = h zy i = 4? 210 = 5 • 



Dann gilt 



b i = = °' 3 • 



Daraus ergibt sich für b 



b = 5 - 0 , 3 • 6 = 3,2 

o ' ' 



und wir erhalten die Geradengleichung 



y = 3,2 + 0 , 3x . 



b) Um Konfidenzintervalle für 3 und ß „ berechnen zu 

o 1 

können, müssen wir annehmen, daß die in Abschnitt 5.1 angege- 
benen Voraussetzungen erfüllt sind. Konfidenzintervalle zur 

Konf idenzzahl 1 ~ a für ß und ß „ sind dann 

o 1 



-i 



Ix 



B o b n-2 ; a/2 S u\ 



nix* 

i 



IX 2 

~2 ' B o + t n-2 ; a/2 S u 



nix? 
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durch 



B 



1 



t n-2;a/2 




B 1 +t n-2;a/2 ( r 

1**1 



Da n-2 > 30 ist, approximieren wir t ^ /0 

- n-2 ; a / 2 

Z a/2 * 1 - a = 0,9544 ergibt sich 



z /0 = 2 . 
a/2 



Für die Realisation von S qilt 

u ^ 



s u = h=? | Iy f _ b i Zx tyi 



■Jq (49 - 0,3-30) 



Aus 



folgt 



v *2 _ 2 -2 
I x* = I x . - nx 
i i 



E x ± 2 = Ix* 2 + nx 2 = 100 + 42-36 = 1612. 



Damit erhalten wir 



+ z /0 s 
o - a/2 u 



Ix 

l 



n E x * 2 

l 



3,2 + 2 .1., 



1612 

y42-100 



=3,2+1 ,2390 



Als Konfidenzintervall für ß Q ergibt sich 



[1,9610 ; 4,4390] 



Entsprechend folgt 



b 1 ± Z a/2 




0,3 + 2 




0,3 + 0,2 
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Das Konfidenzintervall für lautet also 

[0,1 ; 0,5]. 

c) Die Nullhypothese 

H : ß 1 < 0 

o 1 = 

wird beim Signifikanzniveau 1 % abgelehnt, wenn gilt 

— > t 0 i . 

s n - 2 ; o , o 1 

u 

Wegen n-2 > 30 wird t . . durch z . approximiert. 

^ = n-2;o,o1 o,o1 

Es gilt 

4) (z Q t ) = 1 - 0,01 = 0,99 

z , = 2,33 . 

o , ol 

Da die Ungleichung 



b Z x *‘ 
1 V i 



0,3 » 10 



2,33 



erfüllt ist, wird H q beim Signifikanzniveau 
lehnt . 



abge- 



Die Nullhypothese 



wird beim Signifikanzniveau 1 % abgelehnt, wenn die Rea- 

lisation der Prüfgröße 
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7.2 Ein Unternehmer unterstellt, daß seine Kostenkurve 
linear ist. Aus 20 Beobachtungen (x^, y^) ermittelt er 

x = 120 

y = 54 

Ex 2 = 305 000 

l 

I y 2 = 60 400 

2 l 

I x.y . = 1 33 500 

i 2 i 



Hierbei bedeutet x i die in Periode i produzierte Stück- 
zahl, und y^ gibt die dabei auftretenden Kosten in DM an. 
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a) Wie lautet die geschätzte Kostenfunktion? 

b) Geben Sie Konfidenzintervalle zur Konf idenz zah 1 95 % 

für die fixen Kosten und die variablen Stückkosten des 
Unternehmers an. 




133 500 - 20*120*54 
305 000 - 20- 1 20 2 



0,2294 



b Q = y - b ^ x = 54 - 0,2294* 1 20 = 26,472 . 



Die geschätzte Kostenfunktion lautet also 



y = 26,472 + 0,2294-x . 

b) Es sind Konfidenzintervalle zur Konf idenzzahl 0,95 

für die fixen Kosten und die variablen Stückkosten, d. h. 

für 3 und ß «. zu bestimmen. Die Konfidenzintervalle 
o 1 

zur Konf idenzzahl 1 - a lauten 
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bzw . 



B 1 t n - 2 ; a/2 



fP 



B 1 + t n-2 ; a/2 



iR 



Nun ist 



Ix* 2 = I x^ - nx 2 = 305 000 - 20-120 2 = 17 



Weiter gilt für die Realisation von S 

u 

-u [^i 2 - b o Ey i ■ b 1 Ex i y i j 



2 1 



—rr i I y . 2 - bny - b 1 Ix.y. 1 
n-2 li o 1 iij 



jg l 60 400 - 26,472-20*54 - 0,2294-133 



65,852 



und damit 



s u = 8,1147 . 



Für t n -2 ; a/2 er 9 ibt sich wegen n = 20 und a/2 



t 18;o,o25 2,101 



Die Endpunkte des Konfidenzintervalls für ß sind 

o 



26,472 ± 2,101-8,1147 /t!25_000_ 
= 26,472 + 16,147 . 



Als Konfidenzintervall für ß erhält man also 

o 



[ 10,325 ; 42,619] 



000 . 



500 ] 



= 0,025 



dann 
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Für die Endpunkte des Konfidenzintervalls für ß^ gilt 

0,2294 + 2,101 — 

/ 1 7 000 ‘ 

= 0,2294 + 0,1 306 . 

Das gesuchte Konfidenzintervall für ß ^ ist dann 
[0,0988 ; 0,3600] „ 

7.3 Ein Monopolist hat zu einigen Preisen Absatzmengen (pro 
Zeiteinheit) beobachtet 



Preis pro Stück 
in DM 


Absatzmenge 


20 


220 


18 


260 


1 5 


350 


1 2 


480 


10 


600 



a) Schätzen Sie eine Preis-Absatz-Funkt ion konstanter 
Preiselastizität. 

b) Zeichnen Sie das S treuungsdiagramm und die geschätzte 
Preis -Abs atz -Kurve . 

c) Geben Sie Voraussetzungen an, unter denen Konfidenz- 
intervalle für die Preiselastizität konstruiert wer- 
den können. 

d) Berechnen Sie ein Konfidenzintervall zum Sicherheits- 
grad 90 % für die Preiselastizität. 

Lösung : 

Die Elastizität der Absatzmenge Q in bezug auf den Preis 
ist für jeden Punkt der Preis-Absat z-Funktion wie folgt 
definiert 
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_ dQ . dP _ dQ P 
e Q/P Q : P dP ’ Q ' 



ist also der Grenzwert des Quotienten 



relative Mengenänderung 
relative Preisänderung 



Man kann zeigen, daß alle Funktionen konstanter Preiselasti- 
zität der Nachfrage die Gestalt 



besitzen, wobei c und c- reelle Zahlen sind mit c > 0 
oi o 

und c i = e q/p • 

a) Um die Koeffizienten c q und schätzen zu können, 

logarithmieren wir die Preis-Absatz-Funktion 

log Q = log c q + log P . (1) 

Man erhält dadurch eine lineare Funktion in den Variablen 
log Q, log P . Wenn wir also als Beobachtungen wählen 

x ± = log P ± , Y ± = log Q ± i = 1, 2, ..., n 

so können wir die Koeffizienten c. und log c schätzen 

1 3 o 

durch 



Z x . Y . -nxY £ log P . log Q . - — I log P . z log Q . 
r _ ii _ ^l^^in ^ i ^ *i 

^ i 2-2 2 1 2 

Z x. -nx z (log P . ) - - ( z log P . ) 

i i n i 

log c o = K 1 log Q i ~ C TK E log p i • 



Die Berechnung der notwendigen Summen erfolgt in der fol- 
genden Tabelle 
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p . 
1 


log P i 


(log P. ) 
1 


Q i 


log Qi 


logP^ • logCt 


(log Q ± ) ' 


20 


1,3010 


1 ,6926 


220 


2,3424 


3,0475 


5,4868 


18 


1 ,2553 


1 ,5758 


260 


2,4150 


3,0315 


5,8322 


15 


1,1761 


1,3832 


350 


2,5441 


2,9921 


6,4724 


12 


1 ,0792 


1,1647 


4 80 


2,6812 


2,8936 


7,1888 


10 


1 ,0000 


1 , 0000 


600 


2,7782 


2,7782 


7,7184 


L 


5,8116 


6,8163 


- 


12,7609 


14,7429 


32,6986 



Wir erhalten 

14,7429 - 1-5,8116-12,7609 

c- = t 5 = -1 , 4561 

6,8163 - ~ ( 5 , 8 1 1 6 ) 

log c q = 2,5522 + 1,1623-1,4561 = 4,2446 
und damit 



c = 17 563 
o 



Die geschätzte Preis-Absatz-Funktion lautet also 



Q 



17 563 P 



-1 ,4561 



b) Um die geschätzte Preis-Absatz-Kurve ungefähr zeichnen 
zu können, berechnen wir die Funktionswerte Q(10), Q ( 1 5 ) 
und Q ( 20 ) . Wir erhalten 



log Q ( 10) = 4,2446 - 1,4561 log 10 = 2,7885 d. h. 

Q ( 1 0 ) = 614,5 



log Q ( 1 5) = 4,2446 - 1,4561 log 15 = 2,5321 d. h. 

Q ( 1 5) = 340,5 



337 




log Q ( 20) = 4,2446 - 1,4561 log 20 = 2,3502 



d. h. 



Q ( 20 ) = 224,0 . 



Es ergibt sich die Darstellung in Abb. 5 




Abb . 5 



c) Um Konfidenzintervalle für die Regressionskoeffizienten 
konstruieren zu können, mußten wir voraussetzen, daß die 
Zufallsvariable Y für jeden festen Wert der Variablen x 
normalverteilt ist. Wegen (1) müssen wir dann bei der Be- 
rechnung von Konfidenzintervallen für die Preiselastizität 
c^ voraussetzen, daß die Zufallsvariable Y = log Q bei 
vorgegebenem Preis normalverteilt ist. In diesem Falle be- 
sitzt Q bei festem P eine Dichtefunktion, wie sie in 
Abb. 6 dargestellt ist. 
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f (q) 




Abb. 6 

Eine Zuf allsvariable mit einer solchen Dichtefunktion heißt 

lognorma Iverteilt . 

d) Sind die in c) angegebenen Voraussetzungen erfüllt, 
so ist 



C 1 t n-2 ; a/2 




C„+t 

1 n-2 ; a/ 2 



V 



Zx : 






ein Konfidenzintervall zur Konf idenzzahl 1 - a für die 

unbekannte Preiselastizität c- . Um S zu berechnen, 

1 u 

benutzen wir die folgende Beziehung 



S 



2 



u 



_L[ 

n-2 L 



I Y. 



B Z Y . 
o i 



1 

B, Ix.Y. i . 

1 l l J 



Dabei sind , Y^, B q und B^ gemäß Gleichung (1) durch 
log P^, log Q^, log C Q bzw. zu ersetzen. Es gilt also 



s u 2 = ^ [ E (log Q i )2 " log C o 1 log Q i ” C 1 Z log P i l0g Q ij 



Mit den in b) berechneten Werten folgt dann 



3 u 2 = 5^2 [32,6986 - 4,2446*12,7609 + 1,4561*14 
= 0,000 2733 . 



,7429] 
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Ferner ist 



L x* 
1 



Z X ± 2 - E Xi ) 2 = E (log P i ) 2 - E log P ± ) 2 



0,06136 . 



Damit folgt 



°u _ 0,0002733 



I x* 

l 



0,06136 



= 0,0044545 



'3 ; o , o5 



— — = 2,352 /0, 0044545 = 0,156978 



-]/zx* 2 ' 



Die Grenzen des 90 % - Konfidenzintervalls für sind 

dann 



c 



1 



+ t 0 c 
3 ; o , o 5 




1 ,4561 + 0,156978 . 



Das gesuchte 90 % - Konfidenzintervall für die unbekannte 
Preiselastizität ist dann 



[ - 1 ,61308 ; - 1 ,29912 ] . 
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Anhang 



1. Mathematische Hilfsmittel 

1.1 Mengen 

1.1.1 Jede Zusammenfassung von Personen oder Dingen nennt 
man Menge . So spricht man beispielsweise von der Menge der 
Studierenden einer Fakultät, von der Menge der in einem Kreis 
zugelassenen Personenwagen oder von der Menge der ganzen Zah- 
len. Die in einer Menge zusammengefaßten Personen oder Dinge 
bezeichnet man als Elemente der Menge. 

1.1.2 Eine Menge, die nur endlich viele Elemente enthält, 

heißt endlieh. Ist A eine endliche Menge mit den Elementen 
e-j, e 2 , . .., so schreibt man 

A = (e 1 , e 2 , . . . , e k ) . 

Bei unendlichen Mengen gibt man die Elemente soweit an, bis 
das Bildungsgesetz für alle weiteren Elemente klar ist, oder 
man nennt die Eigenschaften, durch die die Elemente der Men- 
ge charakterisiert sind. Zum Beispiel ist 

{2,4,6,...} 

die Menge der (positiven) geraden Zahlen und 
{x : x reell, x > 0} 

die Menge aller positiven reellen Zahlen. 

1.1.3 A sei eine beliebige Menge. Für "e ist ein Element 
von A" schreibt man kurz 

e e A 
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und für die Negation "e ist kein Element von A 



e £ A. 



Ist A - {1,2,3,...} die Menge aller natürlichen Zahlen, so 
gilt z. B. 1 e A, 0 i A. 

1.1.4 Wir bezeichnen mit IR die Menge der reellen Zahlen. 
Für a, b e IR, a < b setzt man 

[a,b] = { x e R : a < x < b} 

(a,b) = {xeR:a<x<b} 

(a,b] = {x e R : a < x < b} 

[a,b) = {x e R : a < x < b } . 

Diese Mengen heißen endliche Intervalle mit den Endpunkten 
a und b; [a,b] nennt man abgeschlossen , (a,b) offen und 

(a,b] sowie [a,b) halboffen . Als unendliche Intervalle be- 
zeichnet man die Mengen (a e R) 

( — 00 , a] = {x e R : x < a} 

( -0 ° , a) = {x e R : x < a} 

[a,+«) = {x e R : x > a} 

(a,+«) = {x e R : x > a} 



sowie 



(-oo,+°°) = R. 

1.1.5 Eine Menge B heißt Teilmenge einer Menge A, in Zei- 
chen: B C A, wenn jedes Element von B auch Element von A ist. 
Zum Beispiel sind alle Intervalle Teilmengen von IR. - Die 
Menge {2,4,6,...} der geraden Zahlen ist eine Teilmenge der 
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Menge {1,2,3,...} der natürlichen Zahlen. 

Nach der obigen Definition gilt stets 
A C A. 

Aus formalen Gründen wird ferner die sogenannte leere Men- 
ge 0, die überhaupt kein Element enthält, als Teilmenge 
einer jeden Menge A angesehen. 

1.1.6 Im folgenden sei fl eine fest gewählte Menge. - Ist A 
eine Teilmenge von fl, so ist auch die Gesamtheit aller Ele- 
mente von fl, die nicht zu A gehören, eine Teilmenge von fl; 
wir bezeichnen sie mit Ä: 

Ä = { e e fi : e £ A} . 

Ä wird zu A komplementäre Menge oder Komplement von A (be- 
züglich fl) genannt. 

Ist fl beispielsweise die Menge der natürlichen Zahlen und 
A = (2,4,6,. . . } 

die Menge der geraden Zahlen, so ist das Komplement von A 
die Menge der ungeraden Zahlen 

Ä = {1,3,5,...}. 

1.1.7 A und B seien Teilmengen von fl. Die Gesamtheit aller 
Elemente von fl, die zu (wenigstens) einer der beiden Teil- 
mengen A und B gehören, stellt gleichfalls eine Teilmenge 
von fl dar, die mit AvB (lies: A vereinigt B) bezeichnet 
wird 



Av/B = {e £ fl :eeA oder e e B}. 

AvB heißt die Vereinigung der Teilmengen A und B. 
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Ebenso ist die Menge aller Elemente von ß, die sowohl zu A 
als auch zu B gehören, eine Teilmenge von ß. Sie wird mit 
AaB (lies: A geschnitten B) bezeichnet und heißt der Durch- 
schnitt der Teilmengen A und B 

AaB = {e e ß : e e A, e e B}. 

Wenn es kein Element e e ß gibt, das beiden Teilmengen A und 
B angehört, gilt 

A A B = 0. 

Die Teilmengen A und B heißen dann disjunkt. Zum Beispiel 
sind A und Ä stets disjunkte Mengen. 

1.1.8 Beispiel : Es sei ß = {1,2,3,...} und A = {2,4,6}, 

B = {2,3,4}, C = {3,5} i Dann gilt 



AV B = {2,3, 4, 6} 


A/\ B = {2,4} , 


AVC = {2, 3, 4, 5, 6} , 


AAC = 0 , 


BVC = {2,3, 4, 5} 


BAC = {3} . 



A und C sind also disjunkt. 

1.1.9 Die zwischen Teilmengen einer Menge ß bestehenden Be- 
ziehungen lassen sich in einfacher Weise durch ein sogenann- 
tes VENN-Diagramm veranschaulichen. Dazu symbolisiert man 
jede der interessierenden Teilmengen durch ein möglichst 
einfaches Flächenstück in der Zeichenebene, wobei man auf 
folgendes achten sollte 

(a) Die Flächenstücke für je zwei Teilmengen sollen sich 
nur dann nicht überlappen, wenn bekannt ist, daß diese 
Teilmengen disjunkt sind. 

(b) Wenn eine Menge Teilmenge einer anderen Menge ist, so 
soll das ihr zugeordnete Flächenstück ganz von dem der 
umfassenden Menge zugeordneten Flächenstück überdeckt 
werden . 
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1.1.10 Beispiel : A und B seien zwei Teilmengen von ft . In 
Abb . 1 ist das A entsprechende Flächenstück waagerecht, das 
B entsprechende senkrecht schraffiert. A vy B ist dargestellt 
durch die (waagerecht oder senkrecht) schraffierte Fläche, 
AaB durch die doppelt schraffierte Fläche. 




Abb. 1 

1.1.11 Anhand eines VENN-Diagramms wollen wir uns überle- 
gen, daß für beliebige Teilmengen A und B einer Menge ft 
gilt 

A v B = ÄaB 
AaB = ÄVB. 

In Abb. 2 sind Ä und B waagerecht bzw. senkrecht schraffiert. 
Der Durchschnitt Äa B ist daher die doppelt schraffierte 
Menge, also offensichtlich gleich dem Komplement von AVB 

A\yB = Ä r\ B . 

ÄvB ist der schraffierte und A^B der unschraf f ierte Teil 
von ft. Ä\y B ist daher gleich dem Komplement von AaB 

AyÄ~B = Ä \j B . 




Abb. 2 
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1.1.12 Vereinigung und Durchschnitt werden in naheliegender 
Weise auch für beliebig viele Teilmengen einer Menge ß defi- 
niert. Sind A 1 , A 2 , ... Teilmengen von ß, so versteht man 
unter ihrer Vereinigung VA, = A 1 vA 2 v ... die Menge aller 
Elemente von ß, die mindestens einer Menge A^ angehören 

V> / A i = {eeß:eeA i für mindestens ein i }. 

Der Durchschnitt Aa. = A^A A 2 A . . . ist die Menge der Elemen- 
te von ß, die zu allen Mengen A^ , a 2 , . .. gehören 

/AA i = {eeß:eeA i für alle i }. 

1.1.13 A sei eine beliebige Teilmenge von ß. Ein System von 
Teilmengen A.j, a 2 , ... heißt eine Zerlegung von A, wenn 

A i , A 2 f ... paarweise disjunkt sind, wenn also 

A ± A A j = 0 für i j 

gilt, und wenn die Vereinigung aller A i gleich A ist 
A = VA, . 

Jedes Element von A liegt also in genau einer Menge A^ . 

1.1.14 Beispiele : a) Es sei ß = {1,2,3, ...} und 

A = (1,2, . ..,10}. Die Mengen 

A 1 = {1,3,5} 

A 2 = {2,4,6} 

A 3 = {7} 

A 4 = {8,9,10} 

bilden eine Zerlegung von A. 

b) Es sei ß = IR und A = {x e IR : x > 0} . Die halboffenen 
Intervalle 
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— (i 1 > i ] i - 1*2,... 

bilden eine Zerlegung von A. 

1.1.15 A^ , A 2 , ... sei eine Zerlegung von ft. Für jede Teil- 
menge A C ft ist dann das System der Durchschnitte 

^ A ^ -| / A ^2 r • • • 

eine Zerlegung von A (vgl. Abb. 3) . 




Abb. 3 

Insbesondere ist für beliebige Teilmengen A und B 
AaB, AaB 

eine Zerlegung von A, da B und B eine Zerlegung von ft bilden. 

1.1.16 A^ , A 2 , ... und B^, B 2 , ... seien Zerlegungen von ft. 
Die Ereignisse 

V' B r a. a b 2/ ... 

bilden eine Zerlegung von A^ (i = 1, 2, ...); das System 

aller Durchschnitte 

A ± AB j i = 1 , 2, . . . ; j = 1 , 2, . . . 

ist daher ebenfalls eine Zerlegung von ft. 
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1.2 Zahlerttupel 



1.2.1 A und B seien beliebige Mengen. Die Menge aller Paare 
(a,b) mit a e A und b e B heißt das (kartesische ) Produkt 
von A und B und wird mit A x B bezeichnet 

A x B = { (a,b) : a e A, b e B}. 

A und B heißen die Faktoren des Produktes. 

1.2.2 Beispiele : a) Das Produkt der Mengen A = {1,2,3} 

und B = {a,b} ist die Menge 

A x B = { (1 ,a) , (1 ,b) , (2,a) , (2,b) , (3,a) , (3,b) }. 

b) Das Produkt 

R x R = { (x,y) : x,y e IR} 

ist die Menge aller reellen Zahlenpaare, d. h. die Zahlen- 
ebene . 

(c) Für beliebige Intervalle I = [x^ ,x 2 J und J = [’y^ ,y 2 ] 
ist das Produkt 

I x J = { (x,y ) : x 1 < x < x 2 , y 1 < y < y 2 } 

ein achsenparalleles Rechteck in der x,y-Ebene (vgl. Abb. 4) 

y 




Abb. 4 
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1.2.3 Die Definition der Produktmenge kann auf den Fall meh- 
rerer Faktoren verallgemeinert werden. Sind , A 2 / . . . , A n 

beliebige Mengen, so ist das Produkt A^ x A 2 x ... x A r 

die Menge aller n-Tupel (a^ , a 2 , . . . , a R ) mit a^^ e A^ für 

i = 1 / 2 , ...,n 

A 1 x A 2 x ... x A r = { (a 1 ,a 2 , . . . ,a R ) :a 1 eA 1 , . . . ,a n eA n ) . 

Speziell für das n-fache Produkt IR x IR x ... x IR, also für 
die Menge aller n-Tupel (x^ , x 2 , . . . , x R ) reeller Zahlen, schrei- 
ben wir zur Abkürzung IR n . 

1.2.4 Die Anzahl der Elemente einer endlichen Menge A be- 
zeichnen wir mit | A | . 

A.| und A 2 seien endliche Mengen. Für jedes Element a^ e A^ 
gibt es | A 2 | Paare (a^,a 2 ) mit a 2 e A 2 ; die Anzahl aller 
Paare (a^,a 2 ) mit a^ e A^ und a 2 e A 2 ist also gleich 
| A^ | • | A 2 | , d. h. es gilt 

|A 1 x A 2 | = |A 1 | • |A 2 | . 

Sind A 1 , A 2 , A 3 endliche Mengen, so kann jedes der | A 1 | * | A 2 | 
Paare (a«|,a 2 ) e A^ x A 2 durch ein beliebiges Element a 3 e A^ 
zu einem Tripel (a^,a 2 ,a 2 ) e A^ x A 2 x A^ ergänzt werden. 

Es gilt daher 

I A 1 x A 2 x A 3 | = | A 1 | • | A 2 | • |A 3 | . 

Allgemein hat man für endliche Mengen A^, A 2 , . . . , A n 

I A 1 X A 2 x ... X A n | = |A 1 I • |A 2 I . . . | A n I . 

Wenn beispielsweise 

A 1 = A 2 = ... = A n = { 1 , 2 , . . . ,N } 
gilt, ist 



349 




A 1 x A~ x ... x A 
i z n 

die Menge aller n-Tupel, die aus den Zahlen 1 , 2, ..., N 
gebildet werden können. Es gibt N n derartige n-Tupel. 

1.2.5 ( i , ±2 f • • • r i n ) sei ein aus den Zahlen 1, 2, . .., N 
gebildetes n-Tupel. Wir bezeichnen (i 1 , ± 2 , . . . , i ) als n-Tupel 
ohne Wiederholungen , wenn keine der Zahlen 1, 2, . .., N mehr- 
fach unter den Zahlen i 1 , i 2 , . .., i vorkommt. Wir fragen 
nach der Anzahl der n-Tupel ohne Wiederholungen, die atfs den 
Zahlen 1, 2, ..., N gebildet werden können. 

Im Falle n = 2 gibt es zu jeder Zahl i^ = 1, 2, ..., N 
N-1 Paare (i^,^) mit i 2 = 1 , 2, ..., N und i 2 ^ i^ die 
Anzahl aller Paare (i.,,^) mit i 1 ^ i 2 ist daher gleich N(N-1). 
Jedes der N(N-1) Paare (i.,,i 2 ) mit i 1 ^ i 2 kann zu N-2 Tripeln 
(i-|,i 2 ,i 3 ) mit i 3 f i^ und i 3 f i 2 ergänzt werden. Die Anzahl 
aller Tripel (i^,i 2 ,i 3 ) ohne Wiederholungen ist daher gleich 
N (N- 1 ) (N- 2 ) . Allgemein gibt 

N(N-1 ) . . . (N-n+2) (N-n+1) 

an, wie viele n-Tupel ohne Wiederholungen aus den Zahlen 
1 , 2, . . . , N gebildet werden können. 

1.2.6 Für das Produkt der natürlichen Zahlen 1, 2, ..., n 
verwendet man das Symbol n! (lies: n Fakultät) 

n! = 1*2«...«(n-1)*n. 

Ferner erweist sich die Festsetzung 0! = 1 als zweckmäßig. 

Die Fakultäten lassen sich rekursiv nach der Formel 
(n+1)! = n! (n+1 ) n = 0, 1, 2, ... 

berechnen 



350 




0 ! 


= 




1 


1 ! 


= 




1 


2 ! 


= 




2 


3! 


= 




6 


4 ! 


= 




24 


5! 


= 




120 


6 ! 


= 




720 


7! 


= 


5 


040 


8 ! 


= 


40 


320 


9! 


= 


362 


880 


10 ! 


= 3 


628 


800 



usw. . 

1.2.7 Es seien n beliebige Elemente gegeben. Jede Anordnung 
der n Elemente in einer Reihenfolge nennt man eine Permuta- 
tion dieser Elemente. Die Permutationen der Zahlen 1,2, 3 
z. B. sind 

1 , 2 , 3 2 , 1 , 3 3 , 1 , 2 

1, 3, 2 2, 3, 1 3, 2, 1. 

Die Anzahl der Permutationen der Zahlen 1, 2, ..., n ist 
gleich der Anzahl der n-Tupel ohne Wiederholungen, die aus 
den Zahlen 1, 2, ..., n gebildet werden können, also gleich 

n • (n- 1 )« ... * 2*1 = n I . 

Die Anzahl der Permutationen von n verschiedenen Elementen 
ist somit n I . 

1.2.8 Wir wollen die Anzahl der m-Tupel ( j -j , j 2 r • • • / j m ) mit 

j 2 , ..., j m = 1 , 2 , ..., n bestimmen, bei denen j r j 2 , 

. . . , j m aufsteigend geordnet sind 

1 £ h < < ••• < i n - 

Im Falle n = 5 und m = 3 beispielsweise gibt es 10 Tripel 

( j -I , j 2 ' 3 3 ) mit 1<j-| <j 2 <j 3 <5 
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(1,2,3) (1,2,4) (1,2,5) (1,3,4) (1,3,5) 

(1,4,5) (2,3,4) (2,3,5) (2,4,5) (3,4,5). 



Aus jedem m-Tupel ( j 1 , J 2 , • • • ,j m ) mit 1 < j 1 < j 2 < ... <j m 
entstehen m! m-Tupel ohne Wiederholungen, wenn man die Zah 
len j i , j 2 , . .., j m beliebig permutiert. Da man so alle 
n (n-1 )... (n-m+1 ) m-Tupel ohne Wiederholungen erhält, ist 
die gesuchte Anzahl 



n (n-1 ) . . . (n-m+1 ) 
m! 



n! 

m! (n-m) ! * 



Man führt hierfür das Symbol (lies: n über m) ein 



/n \ = n! 

\m/ m! (n-m) i 



m = 0, 1 , 



, n 



und nennt diese Ausdrücke Binomialkoeffizienten . Für m > n 
setzt man (jj) = 0 (n = 0, 1, 2, ... ). 



Die Anzahl der ganzzahligen m-Tupel ( j ^ , j 2 * • • • / j m ) mit 
1 1 j, < j 2 < ... < j m £ n ist (“). 



1.2.9 Beispiele: a) Das Ausfüllen eines Lottoscheines be 

steht im Ankreuzen von 6 Zahlen in einem Schema, das sich 
aus 49 Zahlen zusammensetzt, d. h. in der Festlegung von 
j 1 * ^ 2 ' • • • t jg mit 



1 ä Di < j 2 < • • • < ^6 = 49 ‘ 

Diese Festlegung kann nach dem Vorangehenden auf 

( 4 ® ) = ' 13 983 816 



verschiedene Weisen erfolgen, 
b) In einem Verein, der 100 Mitglieder hat, soll ein aus 
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3 gleichberechtigten Personen bestehender Vorstand gewählt 
werden. Wie viele Möglichkeiten gibt es? 

Wir denken uns die 100 Mitglieder von 1 bis 100 numeriert. 
Jedes aus den Zahlen 1 , 2, . .., 100 gebildete 3-Tupel 
(j-|fj 2 ^ 3 ^ 1 = ji < J 2 < ^ 3 ^ 100 kennzeichnet dann 

einen möglichen Wahlausgang. Also gibt es 

/10CA 100-99-98 

{ 3 J = 1-2-3 = 161 700 

mögliche Wahlausgänge. 



c) Es sollen "Wörter" aus 7 Buchstaben gebildet werden. In 
jedem "Wort" soll der Buchstabe A dreimal Vorkommen und der 
Buchstabe B viermal. Wieviele derartige "Wörter" gibt es? 

Ein "Wort" bilden, heißt offenbar, 3 von 7 Positionen mit 
dem Buchstaben A belegen und die übrigbleibenden mit dem 
Buchstaben B. Ein "Wort" ist also festgelegt, wenn darüber 
entschieden ist, welchen 3 Positionen j ^ , j 2 / j 3 der Buch- 
stabe A zugeordnet werden soll. Diese 3 Positionen auswählen, 
bedeutet, ein 3-Tupel (j - 1 / 12 ^ 3 ) bilden mit 

1 = 3i < j 2 " 3 3 = 7 ‘ 

Dies kann auf 




7-6-5 

1-2-3 



35 



Arten geschehen. Also gibt es 35 "Wörter" mit der gewünschten 
Eigenschaft . 



1.2.10 Aus der Definition der Binomialkoeffizienten folgt 
unmittelbar : 



( n ) = ( n ) 
V m / vn-m,/ 

Insbesondere gilt 

(S)-O- 



0 < m < n . 



n = 0 , 1 , 2 , 



( 1 ) 



( 2 ) 



n! • 0 ! 



1 
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und 



( 1 ) (n-1 ) (n-1 ) ! 1 ! n n - 1, 2, ... (3) 

Die folgende Anordnung der Binomialkoeffizienten wird PASCAL- 
sches Dreieck genannt 



/°\ 

\oJ 



O-te Zeile 



(o) (1) 



1-te Zeile 



d) (?) (?) 



2-te Zeile 



(?) (?) (?) (?) 



3-te Zeile 



(S) (?)••■ O,) (S) 



/ n+1 > 
V 0 / 



{ n V) 



/n+1 
V m 



) 



/ n \ / n \ n-te Zeile 

Vn-V ln/ 

/ n+1 \ /n+1 \ (n+1 ) -te 

\ n / \n+1 J Zeile 



Jeder Binomialkoeffizient im Innern dieses Dreiecks ist gleich 
der Summe der beiden darüberstehenden Binomialkoeffizienten, 
d. h. es gilt 

(m-l) + (£)“ CV) 1 < m < n. (4) 

Man hat nämlich 



( n ) + /n\ = nj ni 

Vm-V Vm/ (m-1 ) ! (n-m+1 ) ! m! (n-m) ! 



m! (n-m+1 ) ! 



n! (n-m+1 ) 
m! (n-m+1 ) ! 



(n+1 ) 1 = /n+1 \ 

m! (n+1-m) ! \ m ) ' 
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Wegen (2) beginnt und endet jede Zeile im PASCALschen Drei- 
eck mit der Zahl 1. Mit Hilfe des "Additionstheorems" (4) 
läßt sich daher das Dreieck Zeile für Zeile ausfüllen 



1 



1 



1 

1 1 

1 2 1 
13 3 1 

1 4 6 4 1 

5 10 10 5 

6 15 20 15 6 



1 



7 21 



35 35 21 



7 



28 



56 



70 



56 



28 



1 



An zweiter und an vorletzter Stelle der n-ten Zeile (n = 1 , 
2, ...) steht die Zahl n (Regel (3)). Die Regel (1) spiegelt 
sich im symmetrischen Aufbau jeder Zeile wider. 



1.2.11 Beim Ausmultiplizieren des n-fachen Produktes 
(x + y ) • (x + y) ... (x + y ) 

erhält man eine Summe aus einzelnen Produkten, die dadurch 
entstehen, daß aus jeder der n Klammern entweder x oder y 
ausgewählt wird und diese n Zahlen miteinander multipliziert 
werden. Wenn aus der j^-ten, j 2 ~ten, ..., j m ~ten Klammer x 
und aus allen übrigen Klammern y ausgewählt wird, hat das 
Produkt die Form x m y n m (1 = j^ < j 2 <...< j = n, m = 0 > 

2, ..., n) . Da die Anzahl der möglichen m-Tupel ( j ^ , j 2 / • • • / j m ) 
mit 1 = j^ < j 2 ••• < j m = n gleich (^) ist, tritt das 
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Produkt x^y 11 m genau (^)-mal als Summand auf. Folglich erhält 
man den sogenannten binomischen Lehrsatz 



, x n / n \ on, /n\ 1n-1, 

( x + y) = ( 0 ) xy vw xy 

, ( n \ n-1 1 , / n \ n c 
••• + (n-l) X y + ' n - y 



1.3 Summenzeichen 



1.3.1 , x 2 , ..., seien Symbole für N beliebige 

Zahlen. Häufig betrachtet man die Summe 

X 1 + X 2 + ••• + *N 

dieser Zahlen oder die Summe ihrer Quadrate 

2,2 2 

X 1 + * 2 + ••• + • 

Derartige Summen kürzt man mit Hilfe des Summenzeichens E 
ab. Man setzt 



N 

E x. = x 1 + x 9 + 
i=1 1 1 ^ 



+ 



oder allgemeiner für eine beliebige natürliche Zahl m < N 



N 

I 

i=m 



x . 



X 



+ x m+1 + 



+ X-- 



Die linke Seite dieser letzten Gleichung wird gelesen: 
"Summe der x^ für i gleich rn bis N." Die ganzen Zahlen m 
und N heißen Summationsgrenzen, i wird Summationsindex 
genannt . 
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Wegen 



X rr'. + x m+ 1 + ’ ’ * + X N X m+0 + X m+1 + 



ist die Zahl der Summanden von Z x. 

1 

i=m 



+ X m+ (N-m) 
gleich N-m+1 . 



1.3.2 Beispie le : 



a) Es sei x 1 = 3 , x 2 = 5, x 3 = -4, x 4 = 1 . 
Dann ist 



4 

Z x. = 3 + 5 + (-4) +1=5 
i=1 1 

4 

Z x. = -4 + 1 = -3 . 
i=3 



b) Ist der Wert der Summanden x^ vom S ummat ionsindex 
unabhängig, d. h. gilt für i = m, ..., N 

x . = a 
i 

so folgt 
N 

Z x i = a+a+...+a = (N-m+1 ) a . 

i=m v v ^ 

(N-m+ 1 ) -mal 

Insbesondere gilt 

N N 

Z a = N • a und Z 1 = N 

i=1 i=1 



c) Für den in 1.2.11 abgeleiteten binomischen Lehrsatz 
können wir schreiben 



/ , \ n ( n \ i n-i 

(x+y) = z {j) K Y 

i=0 
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1.3.3 Wenn keine Mißverständnisse über den Summationsindex 

oder die Summations grenzen entstehen können, schreibt man 
N 

anstelle von z x. kürzer 
i=1 1 



N 

E x. oder 
i 1 



E x. oder Ex.. 
^ i 1 



Zu bemerken ist, daß der Summations index beliebig geändert 

N 

werden kann. So bezeichnet z x. dieselbe Zahl wie 
N 1=1 

E x^ , da beide Ausdrücke Abkürzungen für x^ + X 2 + . • . + ^ 
sind. 



1.3.4 Häufig kommt es vor, daß der Summations index nicht 
alle Werte von der unteren bis zur oberen Summationsgrenze 
durchlaufen soll. Das kann durch Nebenbedingungen am Sum- 
menzeichen kenntlich gemacht werden. Beispielsweise bedeu- 
tet der Ausdruck 



N 

E 

i=1 

x ± <x 



X . 
1 



für beliebige Zahlen x, x 



len 



*n 



daß nur solche Zah- 



zu addieren sind, für welche gilt 



Man 



schreibt diese Summe oft auch kürzer 



Für x = 3, x.j = -1 , x^ = 5 , x^ = 4 , x^ = 2 z. B. gilt 

E x. = -1 + 2 = 1 . 

x. <3 1 

1= 

1.3.5 Die für Addition geltenden Rechenregeln lassen sich 
natürlich auf das Summenzeichen übertragen. Seien 
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x v x 2 , Xjj , Yy y 2 , y N zwei Zahlenfolgen und 

a, b zwei beliebige Konstanten. Dann gilt 



N N 

E a x . = a £ x . 

i=1 1 i=1 1 

N NN 

£ (ax. + by.) = a £ x. + b £ y. . 
i=1 1 1 i=1 i=1 



(1) 

( 2 ) 



Man beweist die Gültigkeit von (1) bzw . (2) , indem man je- 

weils das Summenzeichen auflöst und die Summanden in geeig- 
neter Weise zusammenfaßt. 

1.3.6 Es interessiere die Summe der Investitionen aller in 
den H = 11 Bundesländern der Bundesrepublik tätigen Unter- 
nehmungen. Sei N h die Zahl der Unternehmungen in Bundes- 
land h (h = 1 , 2 , . . . , 11) und x hi der Investitionsbe- 

trag der i-ten Unternehmung in Bundesland h 
(i = 1 , 2, ..., N h ) . Dann ist 



die In vestitions summe der Unternehmungen in Bundesland h 
und 



H 

£ 

h=1 



£ 

i=1 




(3) 



der Gesamtinvestit ionsbetrag aller in den 1 1 Bundesländern 
tätigen Unternehmungen. Man nennt Ausdrücke der Form (3) 

Doppe Is ummen . 



Anstelle von (3) schreibt man kürzer 



H 

£ 

h=1 



I 

i=1 



x 



hi 
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bzw. 



Z Z x,. oder EI x, . 

h i hl hi 



wenn die Zahlen H, aus dem Zusammenhang bekannt sind. 

1.3.7 Der Definition entsprechend läßt sich das Rechnen 
mit Doppelsummen auf die Regeln für einfache Summen zurück- 
führen. Zum Beispiel gilt 



H N h 

Z Z (a x + b 
h =i i= i h hi h 



y, . ) = Z ( a Z x, + b. Z y. . ^ 
hl h«1 V h i=1 hl h i=1 h1 ' 

H N h H N h 

Za Z x + E b, Z y, . 

h =i h i=i hi h =i h i=i hl 



und für a. = a- = ... = a_ = a , b, = b, = ... = b = b 



H N h 



H N h 



H N h 



Z Z ( ax, . + by, .)=a Z Z x, .+b Z Z y , . . 
h =i i=i hl hl h-i i=i hl h-i i=i hl 



1.3.8 Zuweilen betrachten wir die spezielle Klasse von Dop- 
pelsummen, bei denen 

N h = I für h = 1 , 2, . . . , H 

ist, wobei I eine beliebige natürliche Zahl ist. In diesem 
speziellen Fall hat also (3) die Form 

H I • 



Nehmen wir beispielsweise an, ein Produkt werde auf H Ma- 
schinen gleichzeitig hergestellt - und man interessiere sich 
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für die Gesamtproduktion eines bestimmten Monats. Bezeichnet 
man die Zahl der Arbeitstage mit I und die Produktionsmen- 
ge der h-ten Maschine am i-ten Arbeitstag mit x hi , so ist 

I 



die Monatsproduktion der h-ten Maschine. Die Monatsproduk- 
tion aller Maschinen ist dann 



H I 
I Z 
h=1 i=1 



x 



hi 



Umgekehrt ist 



H 

E x, . 
h =i hl 

die Produktion aller H Maschinen am i-ten Arbeitstag. Sum- 
miert man diese Zahlen für alle Arbeitstage 



I H 
Z E 
i=1 h=1 



x 



hi 



so ergibt sich ebenfalls die Monatsproduktion aller Maschi- 
nen. Es ist also gleichgültig, in welcher Reihenfolge sum- 
miert wird 



H 

E 

h=1 




I H 
E E 
i=1 h=1 



x 



hi 



Man schreibt (4) auch in der Form 



H , I 
E 

h , i = 1 



x 



hi 
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und wenn aus dem Zusammenhang hervorgeht, wie groß H bzw. 
I sind 



IIx, 
h i 



hi 



bzw. I Ix, 



hi 



oder auch (insbesondere, wenn H = I ist) 

£ x, . bzw. £ x, . 

, . hi hi 

h,i 

1.3.9 Sind x^ , x 2 , ..., x 1 und , y 2 , 
ge reelle Zahlen, so gilt 



I 

£ 

i=1 



J 

£ 

j = 1 



x. y . 




, y_ beliebi 
j 



Denn das Produkt 

(x 1 + x 2 + ... + x z ) (y 1 + y 2 + ••• + yj) 

ist gleich der Summe aller Produkte x.y. mit 

i=1, 2, ..., I ; j =1, 2, ..., I . Insbesondere gilt 




1.3.10 Auch bei Doppelsummen können an den Summenzeichen 
Nebenbedingungen stehen. Sind x^ , x 2 , x 3 beliebige Zahlen 
so hat man z. B. 

3 

£ x.x. = x.x 0 + x.x« + x 0 X- 
. l 3 12 13 2 3 

1 r J— 1 

i <j 

3 

£ x.x. = x 9 x 1 + x-.x 1 + x 7 x 0 . 
i,j = 1 1 J z J 1 J z 

i >j 



362 




Ganz allgemein gilt für beliebige Zahlen , X 2 / •••' x j 



Z x . x . 

i,j=i 1 3 

i <j 



Z x . x . 

i,j=i 1 3 

i >j 



Z x . x . 

i,j=i 1 3 

i ti 



Z X.x . + 1 x. X 

1 3 



i» j= ' 

i <3 



1/3 = 1 1 3 

i > j 



2 . Z , X i X j 
1/3 = 1 

i <3 



I x. x_. 
fj = ' 

i^j 



i,j=i 1 3 



l x.x. 

i,j=i 1 3 



I \ 2 

. I X . 

\ i=1 X y 



I x.x. 
1/3=1 1 3 

1=3 

l 2 

Z x. 

1=1 1 
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2.1 Dekadische Logarithmen von n! 



n 


log n ! 


n 


log n ! 


n 


log n ! 


n 


log n ! 


1 


0 , 00000 


51 


66,19065 


101 


159,97433 


151 


264,93587 


2 


0,30103 


52 


67,90665 


102 


161 ,98293 


152 


267,11771 


3 


0,77815 


53 


69,63092 


103 


163,99576 


153 


269,30241 


4 


1 , 38021 


54 


71 ,36332 


104 


166,01280 


154 


271 ,48993 


5 


2,07918 


55 


73,10368 


105 


168,03399 


155 


273,68026 


6 


2,85733 


56 


74,85187 


106 


170,05929 


156 


275,87338 


7 


3,70243 


57 


76,60774 


107 


172,08867 


157 


278,06928 


8 


4,60552 


58 


78,37117 


108 


174,12210 


1 58 


280,26794 


9 


5,55976 


59 


80,14202 


109 


176,15952 


1 59 


282,46934 


10 


6,55976 


60 


81 ,92017 


110 


178,20092 


160 


284,67346 


1 1 


7,60116 


61 


83,70550 


1 1 1 


180,24624 


161 


286,88028 


12 


8,68034 


62 


85,49790 


1 1 2 


182,29546 


162 


289,08980 


13 


9,79428 


63 


87,29724 


113 


184,34854 


163 


291 ,30198 


14 


10,94041 


64 


89 , 10342 


1 1 4 


186,40544 


164 


293,51683 


15 


12,11650 


65 


90,91633 


115 


188,46614 


165 


295,73431 


16 


13,32062 


66 


92,73587 


116 


190,53060 


166 


297,95442 


17 


14,55107 


67 


94,56195 


117 


192,59878 


167 


300,17714 


18 


15,80634 


68 


96,39446 


118 


194,67067 


168 


302,40245 


19 


17,08509 


69 


98,23331 


119 


196,74621 


169 


304,63033 


20 


18,38612 


70 


100,07841 


1 20 


198,82539 


170 


306,86078 


21 


19,70834 


71 


101 ,92966 


121 


200,90818 


171 


309,09378 


22 


21 ,05077 


72 


103,78700 


122 


202,99454 


172 


31 1 , 32931 


23 


22,41249 


73 


105,65032 


123 


205,08444 


173 


313,56735 


24 


23,79271 


74 


107,51955 


124 


207,17787 


174 


315,80790 


25 


25,19065 


75 


109,39461 


125 


209,27478 


175 


318,05094 


26 


26,60562 


76 


1 1 1 ,27543 


126 


211 ,37515 


176 


320,29645 


27 


28,03698 


77 


113,16192 


127 


213,47895 


177 


322,54443 


28 


29,48414 


78 


115,05401 


128 


215,58616 


178 


324,79485 


29 


30,94654 


79 


116,95164 


129 


217,69675 


179 


327,04770 


30 


32,42366 


80 


118,85473 


1 30 


219,81069 


180 


329,30297 


31 


33,91502 


81 


120,76321 


131 


221 ,92796 


181 


331 ,56065 


32 


35,42017 


82 


122,67703 


132 


224,04854 


182 


333,82072 


33 


36,93869 


83 


124,59610 


133 


226,17239 


183 


336,08317 


34 


38,47016 


84 


126,52038 


134 


228,29949 


184 


338,34799 


35 


40,01423 


85 


1 28,44980 


135 


230,42983 


185 


340,61516 


36 


41 ,57054 


86 


130,38430 


136 


232,56337 


186 


342,88467 


37 


43,13874 


87 


132,32382 


137 


234,70009 


187 


345,1 5652 


38 


44,71852 


88 


134,26830 


138 


236,83997 


188 


347,43067 


39 


46,30959 


89 


136,21769 


1 39 


238,98298 


189 


349,70714 


40 


47,91165 


90 


138,17194 


140 


241 ,12911 


190 


351,98589 


41 


49,52443 


91 


140,13098 


141 


243,27833 


191 


354,26692 


42 


51 , 14768 


92 


142,09477 


142 


245,43062 


192 


356,55022 


43 


52,78115 


93 


144,06325 


143 


247,58595 


193 


358,83578 


44 


54,42460 


94 


146,03638 


144 


249,74432 


194 


361 ,12358 


45 


56,07781 


95 


148,01410 


145 


251 ,90568 


195 


363,41362 


46 


57,74057 


96 


149,99637 


1 46 


254,07004 


196 


365,70587 


47 


59,41267 


97 


151 ,9831 4 


147 


256,23735 


197 


368,00034 


48 


61 ,09391 


98 


153,97437 


148 


258,40762 


198 


370,29701 


49 


62,78410 


99 


155,97000 


149 


260,58080 


199 


372,59586 


50 


64,48307 


100 


157,97000 


150 


262,75689 


200 


374,89689 
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n log n! 

201 377,20008 

202 379,50544 

203 381,81293 

204 384,12256 

205 386,43432 

206 388,74818 

207 391,06415 

208 393,38222 

209 395,70236 

210 398,02458 

211 400,34887 

212 402,67520 

213 405,00358 

214 407,33399 

215 409,66643 

216 412,00089 

217 414,33735 

218 416,67580 

219 419,01625 

220 421,35867 

221 423,70306 

222 426,04941 

223 428,39772 

224 430,74797 

225 433,10015 

226 435,45426 

227 437,81028 

228 440,16822 

229 442,52805 

230 444,88978 

231 447,25339 

232 449,61888 

233 451,98624 

234 454,35545 

235 456,72652 

236 459,09943 

237 461,47418 

238 463,85076 

239 466,22916 

240 468,60937 

241 470,99139 

242 473,37520 

243 475,76081 

244 478,14820 

245 480,53736 

246 482,92830 

247 485,32100 

248 487,71545 

249 490,11165 

250 492,50959 



n log n! 

251 494,90926 

252 497,31066 

253 499,71378 

254 502,11861 

255 504,5251 6 

256 506,93340 

257 509,34333 

258 511,75495 

259 514,16825 

260 516,58322 

261 518,99986 

262 521,41816 

263 523,83812 

264 526,25972 

265 528,68297 

266 531,10785 

267 533,53436 

268 535,96250 

269 538,39225 

270 540,82361 

271 543,25658 

272 545,69115 

273 548,12731 

274 550,56506 

275 553,00440 

276 555,44531 

277 557,88779 

278 560,33183 

279 562,77743 

280 565,22459 

281 567,67330 

282 570,12355 

283 572,57533 

284 575,02865 

285 577,48350 

286 579,93986 

287 582,39775 

288 584,85714 

289 587,31804 

290 589,78043 

291 592,24433 

292 594,70971 

293 597,17658 

294 599,64492 

295 602,11475 

296 604,58604 

297 607,05879 

298 609,53301 

299 612,00868 

300 614,48580 



n log n! 

301 616,96437 

302 619,44438 

303 621,92582 

304 624,40869 

305 626,89299 

306 629,37871 

307 631,86585 

308 634,35440 

309 636,84436 

310 639,33572 

311 641,82848 

312 644,32264 

313 646,81818 

314 649,31511 

315 651,81342 

316 654,31311 

317 656,81417 

318 659,31660 

319 661,82039 

320 664,32554 

321 666,83204 

322 669,33990 

323 671,84910 

324 674,35965 

325 676,87153 

326 679,38475 

327 681,89929 

328 684,41517 

329 686,93236 

330 689,45088 

331 691,97071 

332 694,49184 

333 697,01429 

334 699,53803 

335 702,06308 

336 704,58942 

337 707,11705 

338 709,64597 

339 712,17616 

340 714,70764 

341 717,24040 

342 719,77442 

343 722,30972 

344 724,84628 

345 727,38410 

346 729,92317 

347 732,46350 

348 735,00508 

349 737,54791 

350 740,09197 



n log n! 

351 742,63728 

352 745,18382 

353 747,73160 

354 750,28060 

355 752,83083 

356 755,38228 

357 757,93495 

358 760,48883 

359 763,04393 

360 765,60023 

361 768,15774 

362 770,71644 

363 773,27635 

364 775,83745 

365 778,39975 

366 780,96323 

367 783,52789 

368 786,09374 

369 788,66077 

370 791,22897 

371 793,79834 

372 796,36889 

373 798,94059 

374 801,51347 

375 804,08750 

376 806,66268 

377 809,23903 

378 811,81652 

379 814,39516 

380 816,97494 

381 819,55587 

382 822,13793 

383 824,72113 

384 827,30546 

385 829,89092 

386 832,47751 

387 835,06522 

388 837,65405 

389 840,24400 

390 842,83506 

391 845,42724 

392 848,02053 

393 850,61492 

394 853,21042 

395 855,80701 

396 858,40471 

397 861,00350 

398 863,60338 

399 866,20435 

400 868,80641 
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2.2 Zufallszahlen 



03 


47 


43 


73 


86 


36 


96 


47 


36 


61 


46 


98 


63 


71 


62 


33 


26 


16 


80 


45 


97 


74 


24 


67 


62 


42 


81 


1 4 


57 


20 


42 


53 


32 


37 


32 


27 


07 


36 


07 


51 


16 


76 


62 


27 


66 


56 


50 


26 


71 


07 


32 


90 


79 


78 


53 


13 


55 


38 


58 


59 


12 


56 


85 


99 


26 


96 


96 


68 


27 


31 


05 


03 


72 


93 


15 


57 


12 


10 


14 


21 


55 


59 


56 


35 


64 


38 


54 


82 


46 


22 


31 


62 


43 


09 


90 


06 


1 8 


44 


32 


53 


16 


22 


77 


94 


39 


49 


54 


43 


54 


82 


17 


37 


93 


23 


78 


87 


35 


20 


96 


43 


84 


42 


17 


53 


31 


57 


24 


55 


06 


88 


77 


04 


74 


47 


67 


21 


76 


33 


50 


25 


63 


01 


63 


78 


59 


16 


95 


55 


67 


19 


98 


10 


50 


71 


75 


12 


86 


73 


58 


07 


33 


21 


12 


34 


29 


78 


64 


56 


07 


82 


52 


42 


07 


44 


38 


1 5 


51 


00 


1 3 


42 


57 


60 


86 


32 


44 


09 


47 


27 


96 


54 


49 


17 


46 


09 


62 


90 


52 


84 


77 


27 


18 


1 8 


07 


92 


46 


44 


17 


16 


58 


09 


79 


83 


86 


19 


62 


06 


76 


50 


03 


10 


26 


62 


38 


97 


75 


84 


1 6 


07 


44 


99 


83 


1 1 


46 


32 


24 


20 


1 4 


85 


88 


45 


23 


42 


40 


64 


74 


82 


97 


77 


77 


81 


07 


45 


32 


1 4 


08 


32 


98 


94 


07 


72 


52 


36 


28 


19 


95 


50 


92 


26 


1 1 


97 


00 


56 


76 


31 


38 


80 


22 


02 


53 


53 


37 


85 


94 


35 


12 


83 


39 


50 


08 


30 


42 


34 


07 


96 


88 


54 


42 


06 


87 


98 


70 


29 


17 


12 


1 3 


40 


33 


20 


38 


26 


1 3 


89 


51 


03 


74 


17 


76 


37 


13 


04 


56 


62 


18 


37 


35 


96 


83 


50 


87 


75 


97 


12 


25 


93 


47 


70 


33 


24 


03 


54 


99 


49 


57 


22 


77 


88 


42 


95 


45 


72 


16 


64 


36 


16 


00 


04 


43 


18 


66 


79 


16 


08 


15 


04 


72 


33 


27 


1 4 


34 


09 


45 


59 


34 


68 


49 


12 


72 


07 


34 


45 


31 


16 


93 


32 


43 


50 


27 


89 


87 


19 


20 


1 5 


37 


00 


49 


52 


85 


66 


60 


44 


68 


34 


30 


1 3 


70 


55 


74 


30 


77 


40 


44 


22 


78 


84 


26 


04 


33 


46 


09 


52 


74 


57 


25 


65 


76 


59 


29 


97 


68 


60 


71 


91 


38 


67 


54 


13 


58 


18 


24 


76 


27 


42 


37 


86 


53 


48 


55 


90 


65 


72 


96 


57 


69 


36 


10 


96 


46 


92 


42 


45 


00 


39 


68 


29 


61 


66 


37 


32 


20 


30 


77 


84 


57 


03 


29 


10 


45 


65 


04 


26 


29 


94 


98 


94 


24 


68 


49 


69 


10 


82 


53 


75 


91 


93 


30 


34 


25 


20 


57 


27 


16 


90 


82 


66 


59 


83 


62 


64 


1 1 


12 


67 


19 


00 


71 


74 


60 


47 


21 


29 


68 


1 1 


27 


94 


75 


06 


06 


09 


19 


74 


66 


02 


94 


37 


34 


02 


76 


70 


90 


30 


86 


35 


24 


10 


15 


20 


33 


32 


51 


26 


38 


79 


78 


45 


04 


91 


16 


92 


53 


56 


16 


38 


23 


16 


86 


38 


42 


38 


97 


01 


50 


87 


75 


66 


81 


41 


40 


01 


74 


91 


62 


31 


96 


25 


91 


47 


96 


44 


33 


49 


13 


34 


86 


82 


53 


91 


00 


52 


43 


48 


85 


66 


67 


40 


67 


14 


64 


05 


71 


95 


86 


1 1 


05 


65 


09 


68 


76 


83 


20 


37 


90 


14 


90 


84 


45 


1 1 


75 


73 


88 


05 


90 


52 


27 


41 


1 4 


86 


22 


98 


1 2 


22 


08 


68 


05 


51 


18 


00 


33 


96 


02 


75 


19 


07 


60 


62 


93 


55 


59 


33 


82 


43 


90 


20 


46 


78 


73 


90 


97 


51 


40 


14 


02 


04 


02 


33 


31 


08 


39 


54 


16 


49 


36 


64 


19 


58 


97 


79 


15 


06 


1 5 


93 


20 


01 


90 


10 


75 


06 


40 


78 


78 


89 


62 


05 


26 


93 


70 


60 


22 


35 


85 


15 


1 3 


92 


03 


51 


59 


77 


59 


56 


78 


06 


83 


07 


97 


10 


88 


23 


09 


98 


42 


99 


64 


61 


71 


62 


99 


15 


06 


51 


29 


16 


93 


68 


71 


86 


85 


85 


54 


87 


66 


47 


54 


73 


32 


08 


1 1 


12 


44 


95 


92 


63 


16 


26 


99 


61 


65 


53 


58 


37 


78 


80 


70 


42 


10 


50 


67 


42 


32 


17 


55 


85 


74 


14 


65 


52 


68 


75 


87 


59 


36 


22 


41 


26 


78 


63 


06 


55 


13 


08 


27 


01 


50 


17 


53 


77 


58 


71 


71 


41 


61 


50 


72 


12 


41 


94 


96 


26 


44 


95 


27 


36 


99 


90 


26 


59 


21 


19 


23 


52 


23 


33 


12 


96 


93 


02 


18 


39 


07 


02 


18 


36 


07 


41 


23 


52 


55 


99 


31 


04 


49 


69 


96 


10 


47 


48 


45 


88 


1 3 


41 


43 


89 


20 


60 


20 


50 


81 


69 


31 


99 


73 


68 


68 


35 


81 


33 


03 


76 


24 


30 


12 


48 


60 


91 


25 


38 


05 


90 


94 


58 


28 


41 


36 


45 


37 


59 


03 


09 


90 


35 


57 


29 


12 
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2.3 POISSON-Verteilungen 



f (x| X) = 



X x e" X 





0,1 


0,2 


0,3 


0,4 


0,5 


0,6 


0,7 


o 

00 


0,9 


1 ,o 


0 


0,9048 


0,8187 


0,7408 


0,6703 


0,6065 


0,5488 


0,4966 


0,4493 


0,4066 


0,3679 


1 


0,0905 


0,1637 


0,2222 


0,2681 


0,3033 


0,3293 


0,3476 


0,3595 


0,3659 


0,3679 


2 


0,004 5 


0,0164 


0,0333 


0,0536 


0,0758 


0,0988 


0,1217 


0,1438 


0,1 647 


0,1839 


3 


0,0002 


0,001 1 


0,0033 


0,0072 


0,01 26 


0,0198 


0,0284 


0,0383 


0,0494 


0,0613 


4 


0,0000 


0 , 000 1 


0,0003 


0,0007 


0,0016 


0,0030 


0,0050 


0,0077 


0,01 1 1 


0,0153 


5 


0 , 0000 


0 , 0000 


0 , 0000 


0,0001 


0,0002 


0,0004 


0,0007 


0,0012 


0,0020 


0,0031 


6 


0 , 0000 


0 , 0000 


0 , 0000 


0,0000 


0 , 0000 


0 , 0000 


0 , 000 1 


0,0002 


0,0003 


0,0005 


7 | 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0,0001 




1 , 1 


1 , 2 


1 , 3 


1 , 4 


1,5 


1 ,6 


1 ,7 


1 ,8 


1 ,9 


2,0 


0 


0,3329 


0,3012 


0,2725 


0,2466 


0,2231 


0,2019 


0,1827 


0,1653 


0,1496 


0,1353 


1 


0,3662 


0,3614 


0,3543 


0,3452 


0,3347 


0,3230 


0,3106 


0,2975 


0,2842 


0,2707 


2 


0,201 4 


0,2169 


0,2303 


0,2417 


0,2510 


0,2584 


0,2640 


0,2678 


0,2700 


0,2707 


3 


0,0738 


0,0867 


0,0998 


0,1128 


0,1255 


0,1 378 


0,1496 


0,1607 


0,1710 


0,1804 


4 


0,0203 


0,0260 


0,0324 


0,0395 


0,0471 


0,0551 


0,0636 


0,0723 


0,0812 


0,0902 


5 


0,004 5 


0,0062 


0,0084 


0,01 1 1 


0,0141 


0,0176 


0,0216 


0,0260 


0,0309 


0,0361 


6 


0,0008 


0,0012 


0,0018 


0,0026 


0,0035 


0,0047 


0,0061 


0,0078 


0,0098 


0,0120 


7 


0,0001 


0,0002 


0,0003 


0,0005 


0,0008 


0,001 1 


0,0015 


0,0020 


0,0027 


0,0034 


8 


0,0000 


0 , 0000 


0,0001 


0,0001 


0,0001 


0,0002 


0,0003 


0,0005 


0,0006 


0,0009 


9 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0,0001 


0,0001 


0,0001 


0,0002 




2,1 


2,2 


2,3 


2,4 


2 , 5 


2,6 


2,7 


CO 


2,9 


3,0 


0 


0,1225 


0,1108 


0,1003 


0,0907 


0,0821 


0,0743 


0,0672 


0,0608 


0,0550 


0,0498 


1 


0,2572 


0,2438 


0,2306 


0,2177 


0,2052 


0,1931 


0,1815 


0,1703 


0,1 596 


0,1494 


2 


0,2 700 


0,2681 


0,2652 


0,2613 


0,2565 


0,2510 


0,2450 


0,2384 


0,2314 


0,2240 


3 


0,1890 


0,1966 


0,2033 


0,2090 


0,2138 


0,2176 


0,2205 


0,2225 


0,2237 


0,2240 


4 


0,0992 


0,1082 


0,1169 


0,1254 


0,1336 


0,1414 


0,1488 


0,1557 


0,1622 


0,1 680 


5 


0,0417 


0,0476 


0,0538 


0,0602 


0,0668 


0,0735 


0,0804 


0,0872 


0,0940 


0,1008 


6 


0,0146 


0,0174 


0,0206 


0,0241 


0,0278 


0,0319 


0,0362 


0,0407 


0,0455 


0,0504 


7 


0,004 4 


0,005 5 


0,0068 


0,0083 


0 , 009 9 


0,0118 


0,01 39 


0,0163 


0,0188 


0,0216 


8 


0,0011 


0,001 5 


0,0019 


0,0025 


0,0031 


0,0038 


0,0047 


0,0057 


0 , 006 8 


0,0081 


9 


0,0003 


0,0004 


0,0005 


0,0007 


0,0009 


0,001 1 


0,001 4 


0,001 8 


0,002 2 


0,0027 


10 


0,0001 


0,0001 


0 , 000 1 


0,0002 


0,0002 


0,0003 


0,0004 


0,0005 


0,0006 


0,0008 


1 1 


0 , 0000 


0 , 0000 


0 , 0000 


0,0000 


0,0000 


0,0001 


0,0001 


0 , 000 1 


0,0002 


0 , 0002 


12 | 


0 , 0000 


0,0000 


0,0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0 , 0000 


0,0001 
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2.4 Standardnormalverteilung 




0 z 



z 0,00 0,01 0,02 0,03 0,04 

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 

0,7 0,7580 0,7611 0,7642 0,7673 0,7703 

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 

1.0 0,8413 0,8438 0,8461 0,8485 0,8508 

1.1 0,8643 0,8665 0,8686 0,8708 0,8729 

1.2 0,8849 0,8869 0,8888 0,8907 0,8925 

1.3 0,9032 0,9049 0,9066 0,9082 0,9099 

1.4 0,9192 0,9207 0,9222 0,9236 0,9251 

1.5 0,9332 0,9345 0,9357 0,9370 0,9382 

1.6 0,9452 0,9463 0,9474 0,9484 0,9495 

1.7 0,9554 0,9564 0,9573 0,9582 0,9591 

1.8 0,9641 0,9649 0,9656 0,9664 0,9671 

1.9 0,9713 0,9719 0,9726 0,9732 0,9738 

2.0 0,9772 0,9778 0,9783 0,9788 0,9793 

2.1 0,9821 0,9826 0,9830 0,9834 0,9838 

2.2 0,9861 0,9864 0,9868 0,9871 0,9875 

2.3 0,9893 0,9896 0,9898 0,9901 0,9904 

2.4 0,9918 0,9920 0,9922 0,9925 0,9927 

2.5 0,9938 0,9940 0,9941 0,9943 0,9945 

2.6 0,9953 0,9955 0,9956 0,9957 0,9959 

2.7 0,9965 0,9966 0,9967 0,9968 0,9969 

2.8 0,9974 0,9975 0,9976 0,9977 0,9977 

2.9 0,9981 0,9982 0,9982 0,9983 0,9984 

z = 3,0 3,1 3,2 3,3 3,4 

4(z)=0,9987 0,9990 0,9993 0,9995 0,9997 



Die Tabelle enthält zu 
vorgegebenem z den In- 
halt der in der Skizze 
schraffierten Fläche 



0,05 0,06 0,07 0,08 0,09 

0,5199 0,5239 0,5279 0,5319 0,5359 
0,5596 0,5636 0,5675 0,5714 0,5753 
0,5987 0,6026 0,6064 0,6103 0,6141 
0,6368 0,6406 0,6443 0,6480 0,6517 
0,6736 0,6772 0,6808 0,6844 0,6879 

0,7088 0,7123 0,7157 0,7190 0,7224 
0,7422 0,7454 0,7486 0,7517 0,7549 
0,7734 0,7764 0,7794 0,7823 0,7852 
0,8023 0,8051 0,8078 0,8106 0,8133 
0,8289 0,8315 0,8340 0,8365 0,8389 

0,8531 0,8554 0,8577 0,8599 0,8621 
0,8749 0,8770 0,8790 0,8810 0,8830 
0,8944 0,8962 0,8980 0,8997 0,9015 
0,9115 0,9131 0,9147 0,9162 0,9177 
0,9265 0,9279 0,9292 0,9306 0,9319 

0,9394 0,9406 0,9418 0,9429 0,9441 
0,9505 0,9515 0,9525 0,9535 0,9545 
0,9599 0,9608 0,9616 0,9625 0,9633 
0,9678 0,9686 0,9693 0,9699 0,9706 
0,9744 0,9750 0,9756 0,9761 0,9767 

0,9798 0,9803 0,9808 0,9812 0,9817 
0,9842 0,9846 0,9850 0,9854 0,9857 
0,9878 0,9881 0,9884 0,9887 0,9890 
0,9906 0,9909 0,9911 0,9913 0,9916 
0,9929 0,9931 0,9932 0,9934 0,9936 

0,9946 0,9948 0,9949 0,9951 0,9952 
0,9960 0,9961 0,9962 0,9963 0,9964 
0,9970 0,9971 0,9972 0,9973 0,9974 
0,9978 0,9979 0,9979 0,9980 0,9981 
0,9984 0,9985 0,9985 0,9986 0,9986 

3,5 3,6 3,7 3,8 3,9 
0,9998 0,9998 0,9999 0,9999 1,0000 
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2.5 STUDENT-t-Verteilungen 




Die Tabelle gibt t k . a 

an in Abhängigkeit von 
a und der Zahl k der 
Freiheitsgrade 



\a 

k \ 


0,15 


o 

o 


0,05 


0,025 


0,01 


0,005 


0,0005 


1 


1 ,963 


3,078 


6,314 


12,706 


31 ,821 


63,657 


636,619 


2 


1 ,386 


1 ,886 


2,9 20 


4,303 


6,965 


9,925 


31,598 


3 


1,250 


1 ,638 


2,353 


3,182 


4,541 


5,841 


12,924 


4 


1 ,190 


1 ,533 


2,132 


2,776 


3,747 


4,604 


8,610 


5 


1,156 


1 ,476 


2,015 


2,571 


3,365 


4,032 


6,869 


6 


1,134 


1 ,440 


1 ,943 


2,447 


3,143 


3,707 


5,959 


7 


1,119 


1,415 


1 ,895 


2,365 


2,998 


3,499 


5,408 


8 


1 ,108 


1 ,397 


1,860 


2,306 


2,896 


3,355 


5,041 


9 


1,100 


1,383 


1 ,833 


2,262 


2,821 


3,250 


4,781 


10 


1 ,093 


1,372 


1,812 


2,228 


2,764 


3,169 


4,587 


1 1 


1 ,088 


1 ,363 


1 ,796 


2,201 


2,718 


3,106 


4,437 


12 


1 ,083 


1 ,356 


1 ,782 


2,179 


2,681 


3,055 


4,318 


13 


1,079 


1 ,350 


1 ,771 


2,160 


2,650 


3,012 


4,221 


14 


1 ,076 


1 ,345 


1 ,761 


2,145 


2,624 


2,977 


4,140 


15 


1 ,074 


1,341 


1 ,753 


2,131 


2,602 


2,947 


4,073 


16 


1 ,071 


1 ,337 


1 ,746 


2,120 


2,583 


2,921 


4,015 


17 


1 ,069 


1 ,333 


1 ,740 


2,110 


2,567 


2,898 


3,965 


18 


1 ,067 


1 ,330 


1,734 


2,101 


2,552 


2,878 


3,922 


19 


1 ,066 


1 ,328 


1 ,729 


2,093 


2,539 


2,861 


3,883 


20 


1 ,064 


1 ,325 


1 ,725 


2,086 


2,528 


2,845 


3,850 


21 


1 ,063 


1 ,323 


1,721 


2,080 


2,518 


2,831 


3,819 


22 


1 ,061 


1 ,321 


1,717 


2,074 


2,508 


2,819 


3,792 


23 


1 ,060 


1,319 


1,714 


2,069 


2,500 


2,807 


3,767 


24 


1 ,059 


1 ,318 


1,711 


2,064 


2,492 


2,797 


3,745 


25 


1,058 


1 ,316 


1 ,708 


2,060 


2,485 


2,787 


3,725 


26 


1 ,058 


1,315 


1 ,706 


2,056 


2,479 


2,779 


3,707 


27 


1 ,057 


1,314 


1 ,703 


2,052 


2,473 


2,771 


3,690 


28 


1 ,056 


1,313 


1,701 


2,048 


2,467 


2,763 


3,674 


29 


1 ,055 


1,311 


1,699 


2,045 


2,462 


2,756 


3,659 


30 


1 ,055 


1 ,310 


1,697 


2,042 


2,457 


2,750 


3,646 


40 


1 ,050 


1 ,303 


1 ,684 


2,021 


2,423 


2,704 


3,551 


60 


1 ,046 


1,296 


1,671 


2,000 


2,390 


2,660 


3,460 


20 


1,041 


1 ,289 


1,658 


1 ,980 


2,358 


2,617 


3,373 


00 


1 ,036 


1 ,282 


1 ,645 


1,960 


2,326 


2,576 


3,291 



ffl 



2.6 x 2 -Verteilungen 




Die Tabelle gibt x? 

3 k ; a 

an in Abhängigkeit von 
a und der Zahl k der 
Freiheitsgrade 



0,99 0,95 0,50 0,10 0,05 0,02 0,01 



1 


0 , 


,000 


o , 


,004 


0 , 


,455 


2 , 


,706 


3 


,841 


5 , 


,412 


6 ( 


, 635 


2 


0 , 


,020 


0 j 


, 103 


1 , 


r 386 


4 , 


,605 


5 


,991 


7 , 


,824 


9 , 


,210 


3 


0 , 


r 1 1 5 


o , 


,352 


2 , 


,366 


6 , 


,251 


7 


,815 


9 , 


,837 


1 1 , 


,34 5 


4 


o , 


,297 


o , 


,71 1 


3 t 


,357 


7 , 


,779 


9 


,488 


1 1 , 


,668 


13 , 


,217 


5 


0 , 


,554 


1 , 


,145 


4 , 


,351 


9 , 


,236 


1 1 


,070 


13 , 


,388 


15 , 


,086 


6 


0 ( 


,872 


1 , 


,635 


5 ( 


,348 


10 , 


,645 


12 


,592 


15 , 


,033 


16 , 


,812 


7 


1 , 


,239 


2 , 


,167 


6 t 


,346 


12 , 


,017 


1 4 


,067 


16 , 


,622 


18 , 


,475 


8 


1 , 


,646 


2 , 


,733 


1 , 


,344 


13 , 


,362 


15 


,507 


18 , 


,168 


20 , 


,090 


9 


2 j 


,088 


3 , 


,325 


8 , 


,343 


14 , 


,684 


16 


,919 


19 , 


,679 


21 , 


,666 


10 


2 , 


,558 


3 , 


,940 


9 , 


, 342 


15 , 


,987 


18 


,307 


21 , 


,161 


23 , 


,209 


1 1 


3 , 


,053 


4 t 


r 575 


10 , 


,341 


17 , 


,275 


19 


,675 


22 , 


,618 


24 , 


,725 


12 


3 , 


, 571 - 


5 , 


,226 


1 1 i 


,340 


18 , 


, 549 


21 


,026 


24 , 


,054 


26 , 


,217 


13 


4 , 


,107 


5 , 


,892 


12 , 


, 340 


19 , 


,812 


22 


,362 


25 , 


,472 


27 , 


,688 


14 


4 , 


,660 


6 , 


,571 


13 , 


,339 


21 , 


,064 


23 


,685 


26 , 


,873 


29 , 


,141 


15 


5 t 


,229 


7 , 


,261 


14 , 


,339 


22 , 


,307 


24 


,996 


28 , 


,259 


30 , 


,578 


16 


5 t 


,812 


7 t 


,962 


15 , 


,338 


23 , 


, 542 


26 


,296 


29 , 


,633 


32 , 


,000 


17 


6 , 


,408 


8 t 


,672 


16 , 


,338 


24 , 


,7 69 


27 


,587 


30 , 


,995 


3 3 , 


, 409 


18 


1 , 


,01 5 


9 , 


,390 


17 , 


,338 


25 , 


,989 


28 


,869 


32 , 


,346 


34 , 


, 805 


19 


1 , 


,633 


10 , 


,117 


18 , 


,338 


27 , 


,204 


30 


,144 


33 , 


,687 


36 , 


,191 


20 


8 , 


,260 


10 , 


,851 


19 , 


,337 


28 , 


,412 


31 


,410 


35 , 


,020 


37 , 


,566 


21 


8 , 


,897 


11 , 


,591 


20 , 


,337 


29 , 


,615 


32 


,671 


36 , 


,343 


38 , 


,932 


22 


9 , 


,542 


12 , 


,338 


21 , 


,337 


30 , 


,813 


33 


,924 


37 , 


,659 


40 , 


,289 


23 


10 , 


,196 


13 , 


,091 


22 , 


,337 


32 , 


,007 


35 


,172 


38 , 


,968 


41 , 


,638 


24 


10 , 


,856 


13 , 


,848 


23 , 


,337 


33 , 


,196 


36 


,415 


40 , 


,270 


42 , 


,980 


25 


1 1 , 


, 524 


14 , 


,611 


24 , 


,337 


34 , 


,382 


37 


,652 


41 , 


,566 


44 , 


,314 


26 


12 , 


,198 


15 , 


, 379 


25 , 


,336 


35 , 


,563 


38 


,885 


42 , 


,856 


45 , 


,642 


27 


12 , 


,879 


16 , 


,151 


26 , 


,336 


36 , 


,741 


40 


,113 


44 , 


,140 


46 , 


,963 


28 


13 , 


,565 


16 , 


,928 


27 , 


,336 


37 , 


,916 


41 


,337 


45 , 


,419 


48 , 


,278 


29 


1 4 , 


,256 


17 , 


,708 


28 , 


,336 


39 , 


,087 


42 


,557 


46 , 


,693 


49 , 


,588 


30 


14 , 


,953 


18 , 


,493 


29 , 


,336 


40 , 


,256 


43 


,773 


47 , 


,962 


50 , 


,892 
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2.7 F-Verteilungen 




n \ 


1 


2 


3 


4 


5 


1 


161,4 


199,5 


215,7 


224,6 


230,2 


2 


18,51 


19,00 


19,16 


19,25 


19,30 


3 


10,13 


9,55 


9,28 


9,12 


9,01 


4 


7,71 


6,94 


6,59 


6,39 


6,26 


5 


6,61 


5,79 


5,41 


5,19 


5,05 


6 


5,99 


5,14 


4,76 


4,53 


4,39 


7 


5,59 


4,74 


4,35 


4,12 


3,97 


8 


5,32 


4,46 


4,07 


3,83 


3,69 


9 


5,12 


4,26 


3,86 


3,63 


3,48 


10 


4,96 


4,10 


3,71 


3,48 


3,33 


1 1 


4,84 


3,98 


3,59 


3,36 


3,20 


12 


4,75 


3,88 


3,49 


3,26 


3,11 


1 3 


4,67 


3,80 


3,41 


3,18 


3,02 


14 


4,60 


3,74 


3,34 


3,11 


2,96 


15 


4,54 


3,68 


3,29 


3,06 


2,90 


16 


4,49 


3,63 


3,24 


3,01 


2,85 


17 


4,45 


3,59 


3,20 


2,96 


2,81 


18 


4,41 


3,55 


3,15 


2,93 


2,77 


19 


4,38 


3,52 


3,13 


2,90 


2,74 


20 


4,35 


3,49 


3,10 


2,87 


2,71 


21 


4,32 


3,47 


3,07 


2,84 


2,68 


22 


4,30 


3,44 


3,05 


2,82 


2,66 


23 


4,28 


3,42 


3,03 


2,80 


2,64 


24 


4,26 


3,40 


3,01 


2,78 


2,62 


25 


4,24 


3,38 


2,99 


2,76 


2,60 


26 


4,22 


3,37 


2,98 


2,74 


2,59 


27 


4,21 


3,35 


2,96 


2,73 


2,57 


28 


4,20 


3,34 


2,95 


2,71 


2,56 


29 


4,18 


3,33 


2,93 


2,70 


2,54 


30 


4,17 


3,32 


2,92 


2,69 


2,53 


40 


4,08 


3,23 


2,84 


2,61 


2,45 


60 


4,00 


3,15 


2,76 


2,52 


2,37 


120 


3,92 


3,07 


2,68 


2,45 


2,29 


00 


3,84 


2,99 


2,60 


2,37 


2,21 



Die Tabelle gibt 
in Abhängigkeit von der Zahl 
m der Freiheitsgrade des 
Zählers und der Zahl n der 
Freiheitsgrade des Nenners an 



6 6 12 24 



2 34 


1,0 


238,9 


243,9 


249 ,0 


254,3 


19 , 


33 


1 9 , 


,37 


1 9 , 


,41 


19 


,45 


19 , 


,50 


8 , 


94 


8 , 


,84 


8 , 


,74 


8 


,64 


8 , 


,53 


6 , 


16 


6 , 


,04 


5 , 


,91 


5 


,77 


4 , 


,36 


4 , 


95 


4 , 


,82 


4 , 


,68 


4 


,53 


4 , 


,36 


4 , 


,28 


4 , 


,15 


4 , 


,00 


3 


,84 


3 , 


,67 


3 , 


87 


3 t 


,73 


3 , 


,57 


3 


,41 


3 , 


,23 


3 , 


58 


3 , 


,44 


3 , 


,28 


3 


,12 


2 , 


,93 


3 , 


37 


3, 


,23 


3 , 


,07 


2 


,90 


2 , 


,71 


3 , 


22 


3, 


,07 


2 , 


,91 


2 


,74 


2 , 


,54 


3 , 


09 


2 , 


,95 


2, 


,79 


2 


,61 


2 , 


,40 


3 , 


,00 


2, 


,85 


2 , 


,69 


2 


,50 


2 , 


,30 


2 , 


.92 


2 , 


,77 


2 i 


,60 


2 


,42 


2 , 


,21 


2 , 


,85 


2 , 


,70 


2, 


,53 


2 


,35 


2 , 


,13 


2 , 


,79 


2 , 


,64 


2 , 


,48 


2 


,29 


2 , 


,07 


2 , 


,74 


2 t 


,59 


2 , 


,42 


2 


,24 


2 , 


,01 


2 , 


,70 


2 , 


,55 


2 , 


,38 


2 


,19 


1 , 


,96 


2 , 


,66 


2 t 


,51 


2, 


,34 


2 


,15 


1 , 


,92 


2 , 


,63 


2 t 


,48 


2 , 


,31 


2 


,11 


1 , 


,88 


2 , 


,60 


2, 


,45 


2 , 


,28 


2 


,08 


1 , 


,84 


2 , 


,57 


2 , 


,42 


2 t 


,25 


2 


,05 


1 , 


,81 


2 , 


,55 


2 , 


,40 


2 , 


,23 


2 


,03 


1 , 


,78 


2 , 


,53 


2 , 


,38 


2 , 


,20 


2 


,00 


1 , 


,76 


2 , 


,51 


2 , 


,36 


2 , 


,18 


1 


,98 


1 , 


,73 


2 , 


,49 


2 , 


,34 


2 , 


,16 


1 


,96 


1 , 


,71 


2 , 


,47 


2 , 


,32 


2, 


,15 


1 


,95 


1 , 


,69 


2 , 


,46 


2 , 


,30 


2, 


, 1 3 


1 


,93 


1 , 


,67 


2 , 


,44 


2 , 


,29 


2 , 


,12 


1 


,91 


1 , 


,65 


2, 


,43 


2, 


f 28 


2 , 


,10 


1 


,90 


1 , 


,64 


2 , 


,42 


2 , 


,27 


2 , 


,09 


1 


,89 


1 , 


, 62 


2, 


,34 


2 , 


,18 


2 , 


,00 


1 


,79 


1 , 


,51 


2 , 


,25 


2 , 


,10 


1 ( 


,92 


1 


,70 


1 , 


,39 


2, 


,17 


2 , 


,02 


1 , 


,83 


1 


,61 


1 , 


,25 


2, 


,10 


1 , 


,94 


1 , 


,75 


1 


,52 


1 , 


,00 
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Die Tabelle gibt F^ „ ~ 
in Abhängigkeit von der Zahl 
m der Freiheitsgrade des 
Zählers und der Zahl n der 
Freiheitsgrade des Nenners an 



\ m 
n\ 


1 


2 


3 


4 


5 


6 


8 


12 


24 


00 


1 


4052 


4999 


5403 


5625 


5764 


5859 


5982 


6106 


6234 


6366 


2 


9 8/50 


99,00 


99,17 


99 ,25 


99 , 30 


99,33 


99 , 37 


99,42 


99,46 


99 , 50 


3 


34,12 


30,82 


29,46 


28,71 


28,24 


27,91 


27,49 


27,05 


26,60 


26,12 


4 


21 , 20 


18,00 


16,69 


15,98 


15,52 


15,21 


14,80 


14,37 


13,93 


13,46 


5 


16,26 


13,27 


1 2,06 


11,39 


10,97 


10,67 


10,29 


9,89 


9,47 


9,02 


6 


13,74 


10,92 


9,78 


9,15 


8,75 


8,47 


8,10 


7,72 


7,31 


6,88 


7 


12,25 


9,55 


8,45 


7,85 


7,46 


7,19 


6,84 


6,47 


6,07 


5,65 


8 


11,26 


8,65 


7 , 59 


7,01 


6,63 


6,37 


6,03 


5,67 


5 ,28 


4 , 86 


9 


10,56 


8,02 


6,99 


6,42 


6,06 


5,80 


5,47 


5,11 


4,73 


4,31 


10 


10,04 


7,56 


6,55 


5,99 


5,64 


5,39 


5,06 


4,71 


4,33 


3,91 


1 1 


9,65 


7 , 20 


6 , 22 


5,67 


5,32 


5,07 


4,74 


4,40 


4,02 


3,60 


1 2 


9,33 


6,93 


5,95 


5,41 


5,06 


4,82 


4,50 


4,16 


3,78 


3,36 


1 3 


9,07 


6 , 70 


5,74 


5,20 


4,86 


4,62 


4 , 30 


3,96 


3,59 


3,16 


1 4 


8,86 


6,51 


5,56 


5,03 


4 , 69 


4,46 


4,14 


3 , 80 


3,43 


3,00 


15 


8,68 


6,36 


5,42 


4 ,89 


4,56 


4 , 32 


4,00 


3,67 


3,29 


2,87 


16 


8,53 


6,23 


5,29 


4,77 


4 ,44 


4 , 20 


3,89 


3,55 


3,18 


2,75 


1 7 


8,40 


6,11 


5,18 


4,67 


4 ,34 


4 ,10 


3,79 


3,45 


3,08 


2,65 


18 


8,28 


6,01 


5,09 


4,58 


4,25 


4,01 


3,71 


3,37 


3,00 


2,57 


19 


8,18 


5,93 


5,01 


4 , 50 


4,17 


3,94 


3,63 


3,30 


2,92 


2,49 


20 


8,10 


5,85 


4,94 


4 ,43 


4,10 


3,87 


3 , 56 


3,23 


2,86 


2,42 


21 


8,02 


5,78 


4,87 


4,37 


4,04 


3,81 


3,51 


3,17 


2,80 


2,36 


22 


7,94 


5,72 


4 , 82 


4,31 


3,99 


3,76 


3,45 


3,12 


2,75 


2,31 


23 


7,88 


5,66 


4,76 


4,26 


3,94 


3,71 


3,41 


3,07 


2,70 


2,26 


24 


7,82 


5,61 


4,72 


4,22 


3 , 90 


3,67 


3,36 


3,03 


2,66 


2,21 


25 


7,77 


5,57 


4,68 


4,18 


3,86 


3,63 


3,32 


2,99 


2,62 


2,17 


26 


7,72 


5,53 


4,64 


4,14 


3,82 


3,59 


3,29 


2,96 


2,58 


2,13 


27 


7,68 


5,49 


4 , 60 


4,11 


3,78 


3,56 


3,26 


2,93 


2 ,55 


2,10 


28 


7,64 


5,45 


4,57 


4,07 


3,75 


3,53 


3,23 


2,90 


2,52 


2,06 


29 


7,60 


5,42 


4 , 54 


4,04 


3,73 


3 , 50 


3 , 20 


2,87 


2 , 4 § 


2,03 


30 


7 ,56 


5,39 


4 , 51 


4,02 


3,70 


3,47 


3,17 


2,84 


2,47 


2,01 


40 


7,31 


5,18 


4,31 


3,83 


3,51 


3,29 


2,99 


2,66 


2,29 


1 ,80 


60 


7,08 


4,98 


4,13 


3,65 


3,3 4 


3,12 


2,82 


2,50 


2,12 


1 ,60 


120 


6,85 


4,79 


3,95 


3,48 


3,17 


2,96 


2,66 


2,34 


1 ,95 


1 ,38 


oo 


6,64 


4,60 


3,78 


3,32 


3,02 


2,80 


2,51 


2,18 


1 ,79 


1 ,00 
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Verzeichnis häufig verwendeter Symbole 
und Approximationen 



Die den Symbolen nachgestellten Ziffern verweisen auf die 
Seiten, auf welchen das betreffende Symbol erläutert wird. 



n ! 


342 




EX 


59, 


n ) 

m / 


350 




var X 


70 


CO 


352 




cov ( X , Y ) 


76 


I 


357 




P (X , Y ) 


77 


!R 


342 




tp (x | y , ü) 


121 


0 


343 




4> (x y ,a) 


122 


n 


2 




cp (x) , (z ) 


123 


{e 1 , . . 


*' e n } 341 




a 


237 


e / i 


341 , 


342 


1 - a 


172 


C 


342 




z 

a 


126 


w 


343, 


346 


t k;a 


133 


A 


344 , 


346 


2 

x k ; a 


132 


A x B 


348 




F 

m , n ; a 


1 35 


Ä 


343 




H 

o 


236 


|A| 


349 




K 


237 


W(A) 


1 1 




a (y ) 


239 


W(X = 


a) 35 




ß (y) 


242 


W( . . . 


| y) 238 




ß o ' ß 1 


312 


X Ä 


94 




B o ' B 1 


319 


X , s 2 


82, 


195 


s 2 

u 


324 


p 


95, 


200 
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Faustregeln für die Approximation 



1. spezieller diskreter Verteilungen (vgl. S. 110, 111 und 144) 




2. der Verteilung des Stichprobenmittels X und des Stich- 
probenanteils P i 

W( - - ■ - /n < x ) -> 4> (x) 

W ( : P --- /n < x) -► <J> (x) 

Vp ( 1 -pT 

bei n > 50 (vgl. S. 138 und 142). 

Beim Ziehen ohne Zurücklegen zusätzlich: < 0,05 

(vgl. S. 199) . 



3. der Verteilungen von 



(n . -ne 

Y i i— 

L ne . 



und II — 









durch x “Verteilungen : 



bei ne i > 5 bzw. 



> 5 



(vgl. S. 265 und 271 ) . 



4. der STUDENT-t-Verteilung : 



f n (t) - cp(t) 

bei n > 30 (vgl. S. 133) . 
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